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淋漓 尽 致 展现 算法 本 质 
广泛 涵盖 常用 算法 结构 及 应 用 
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和 觉悟 ， 与 我 们 共同 保护 知识 产权 。 


如 果 购 买 者 有 侵权 行为 ， 我 们 可 能 
对 该 用 户 实 施 包括 但 不 限于 关闭 该 
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一 一 王晓华 上 一 一 


2005 年 毕业 于 华中 科技 大 学 ， 目 前 在 中 
兴 通 讯 上 海 研 发 中 心 从 事 光纤 接 入 网 通讯 设 
备 开 发 ， 担 任 EPON ( 以 太 网 无 源 光 网 络 ) 
业务 软件 开发 经 理 ， 参 与 开发 的 PON 设 备 在 
全 球 部 署 过 亿 线 ， 为 数 亿 家 庭 提供 宽带 接 入 
服务 。 


业余 时 间 喜 欢 研究 算法 和 写作 博客 ， 最 大 
的 乐趣 就 是 用 程序 解决 生活 中 的 问题 : 


友 为 了 方便 使 用 Visual Studio 6.0 开 发 软件 ， 曾 
特意 编写 并 开源 了 一 个 tabbar 插 件 ; 

妈 为 了 文档 安全 ， 开 发 了 一 个 基于 layerFSD 技 
术 的 透明 文件 加 密 系统 ; 

妈 使 用 Source Insight 软 件 觉得 不 习惯 ， 于 是 以 
外 挂 的 形式 开发 了 TabSiPlus 插 件 …… 


算法 可 以 做 的 事情 还 有 很 多 ， 期 待 我 们 
会 有 更 多 发 现 ! 


一 了 T§ 作者 博客 上 一 
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到 版 本 图 书馆 CIP 数 据 核 字 (2015) 第 033951 号 


容 提 要 


本 书 从 一 系列 有 趣 的 生活 实例 出 发 ， et 其 广泛 应 用 ， 生 动 地 展现 了 算 
一 部 分 介绍 了 算法 的 概念 、 常 用 的 算法 结构 以 及 实现 方法 ， 


法 的 趣味 性 和 实用 性 。 全 书 分 为 两 个 部 分 ， 
第 二 部 分 介绍 了 算法 在 各 个 领域 的 应 用 ， 如 移 理 


实验 、 计 算 机 图 形 学 


、 数 字音 频 处 理 等 。 其 中 ， 既 有 各 种 


大 名 时 时 的 算法 ， 如 神经 网 络 、 遗 传 算法 、 离 散 傅 里 叶 变 换算 法 及 各 种 插值 算法 ， 也 有 不 起 眼 的 排序 和 概 
对 程序 员 有 很 大 的 启发 意义 。 书 中 所 有 的 示例 都 与 生活 息 
让 你 爱 上 算法 ， 乐 在 其 中 。 


率 计 算 算 法 。 讲 解 线 显 易 懂 而 不 失 次 度 和 严谨 ， 
息 相 关 ， 淋 漓 尽 致 地 展现 了 算法 解决 问题 的 本 质 ， 


本 书 适合 软件 开发 人 员 、 编 程 和 算法 爱好 者 以 及 计算 机 专业 的 学 生 阅 读 。 


4 车 王晓华 
责任 编辑 “ 王 军 花 


执行 编辑 张 起 
责任 印 制 ” 杨 林 杰 


9 人 民 邮 电 出 版 社 出 版 发 行 ”北京 市 
邮编 100164 ”电子 邮件 
网 址 ”http://www.ptpress.com.cn 
北京 印刷 

本 


开本 : 800X1000 1/16 
印张 : 26.25 
614 千 字 


: 13 801- 14 800 册 


ly 


2015 年 4 


月 第 1 版 


区 成 寿 寺 路 11 号 
315@ptpress.com.cn 


2017 年 1 月 北京 第 7 次 印刷 


定价 : 79.00 元 


读者 服务 热线 : (010)51095186 转 600” 印 装 质 量 热线 : (010)81055316 
反 盗 版 热线 : (010)81055315 


广告 经 营 许可 证 : 京东 工商 广 字 第 8052 号 


订 二 


读 《 算 法 的 乐趣 》 的 乐趣 超出 了 我 的 预料 。 

说 到 算法 ， 大 部 分 计算 机 专业 的 同学 的 第 一 反应 估计 是 MIT 出 版 社 的 经 典 教材 《算法 导论 》 
( Introduction to Algorithms )。 这 是 一 本 由 浅 入 深 的 好 书 ， 塔 称 “ 神 书 ” 一 一 别 看 书 挺 厚 ， 但 是 对 
初学 者 来 说 很 难 弄 懂 的 问题 也 九 九 道 来 , 让 人 看 一 遍 就 明白 ; 而 且 作 者 用 最 简单 的 英语 词汇 和 和 名 
法 写 书 , 以 至 于 世界 各 地 的 学 生 们 , 不 需要 英语 很 好 , 即 可 读 懂 原版 。 只 是 看 完 这 本 大 部 头 之 后 ， 
总 有 一 些 意犹未尽 的 感觉 一 一 对 我 们 日 常生 活 中 常见 的 比如 音乐 播放 器 里 以 及 电子 游戏 里 的 算 
法 并 没有 太 多 介绍 。 而 这 些 正 是 《算法 的 乐趣 》 中 主要 的 部 分 。 

在 Amazon 上， 另外 两 本 排名 靠 前 的 经 典 算法 教材 是 Jon Kleinberg 的 《算法 设计 》( Algorithm 
Design ) 和 Steven S. Skiena 的 《算法 设计 手册 》( The 4lgorithm Design Manual )。 这 两 本 出 自 名 家 
之 手 的 教材 和 很 多 教材 一 样 , 按照 算法 的 类 型 或 者 背后 的 设计 思路 来 组 织 内 容 。 这 是 教材 应 该 做 
的 ，“ 授 人 以 鱼 不 如 授 人 以 渔 ”, 传授 思路 而 不 是 算法 本 身 是 教材 的 写作 目的 。 可 是 算法 最 有 意 
思 的 地 方 首先 在 于 算法 本 身 , 因为 算法 是 为 了 解决 实际 问题 而 设计 的 , 所 以 让 大 家 认识 到 算法 奥 
妙 的 自然 顺序 应 该 是 先 展示 有 趣 的 问题 ,再 展示 优雅 的 算法 ,最 后 归纳 设计 思路 。 而 这 正 是 《 算 
法 的 乐趣 》 吸 引 人 的 地 方 。 


说 到 乐趣 , 总 让 我 想起 我 学 习 和 使 用 数学 知识 的 经 历 。 虽 然 我 的 学 位 是 关于 统计 机 天 学 习 的 ， 
而 且 毕 业 后 一 直 从 事 相 关 工作 , 但 是 我 从 小 学 一 年 级 到 博士 第 三 年 都 对 数学 毫 无 兴趣 , 因为 学 校 
的 老师 和 数学 成 绩 好 的 同学 都 说 不 明白 数学 的 用 处 , 以 至 于 我 一 直 以 为 数学 的 作用 只 是 锻炼 和 展 
示 自 己 的 聪明 , 博得 老师 的 表扬 , 成 为 陈景润 那样 为 国 争光 的 英雄 。 而 这 些 对 我 实在 没有 吸引 力 ， 
而 且 我 认为 恐怕 对 绝 大 部 分 学 生 都 没什么 吸引 力 。 

我 认识 到 数学 的 价值 , 是 因为 在 博士 第 三 年 把 研究 方向 换 到 了 统计 机 器 学 习 。 在 读 教 材 的 时 
候 , 我 兽 想 验证 “数学 无 用 ”, 所 以 费 尽心 力 地 试图 写 一 个 程序 来 判断 一 个 64 x 64 像 素 的 图 片 里 
到 底 是 数字 “1” 还 是 数字 “9”， 却 发 现 无 论 如 何 也 很 难 写 一 个 有 效 的 程序 ; 可 是 利用 教材 里 的 
数学 知识 却 能 设计 和 “训练 ”一 个 数学 模型 ， 准 确 地 识别 任意 字符 。 因 为 体会 到 了 数学 的 用 处 ， 
我 兴奋 地 用 了 一 年 的 时 间 复 习 大 学 本 科 的 数学 课程 ， 然 后 才 读 懂 了 人 工 智能 的 专业 教材 和 论文 。 
此 后 才 有 所 创新 ， 发 表 论 文 ， 到 博士 毕业 。 这 整个 过 程 用 了 三 年 ， 而 效果 超过 了 之 前 19 年 数学 教 


育 的 效果 。 


2 区 序 


在 这 个 过 程 中 , 我 自然 而 然 地 开始 注意 数学 知识 的 前 因 ( 比如 为 什么 人 们 会 关注 长 度 、 面积， 
怎么 会 有 人 考虑 勾 股 定理 这 样 的 规律 ) 以 及 后 果 ( 今天 的 数学 知识 能 给 物理 学 和 机 带 智 能 带 来 什 
么 样 的 帮助 ) ， 也 开始 归纳 和 了 人 解 各 种 数学 系统 背后 的 规律 ,能 体会 哥 德 尔 定 理 阐 述 的 意思 。 当 
然 ， 也 破除 了 “数学 是 各 种 科学 之 母 ”之 类 的 迷信 ， 数 学 当然 不 是 “科学 之 母 ”， 而 是 “科学 之 
子 ”, 是 先 有 物理 学 、 力 学 和 天 文学 , 才 有 的 数学 ; 先 有 应 用 场景 后 有 工具 , 先 有 探索 后 有 归纳 。 

算法 也 是 如 此 。 先 有 工程 问题 需要 解决 , 算法 是 解法 , 设计 算法 是 寻求 解法 。 虽然 算法 作为 

门 科学 是 归纳 寻求 解法 的 思路 ,但 学 习 这 种 归纳 法 的 前 提 是 能 体会 各 种 具体 算法 的 用 处 和 效 
果 。 意识 到 这 一 点 ， 自 然 也 就 破除 了 诸如 “学 好 数学 才能 学 好 算法 ”之 类 的 迷信 。 而 把 算法 解决 
的 各 种 有 趣 问 题 罗 列 出 来 ， 把 算法 的 可 爱 之 处 展示 给 愿意 发 现 和 体会 生活 中 点 滴 乐 趣 的 读者 们 ， 
正 是 《算法 的 乐趣 》 在 技术 价值 之 外 的 一 层 社 会 价值 。 


十 年 前 ， 当 我 们 坐 在 课堂 里 学 习 算法 的 时 候 , 我 们 学 到 的 是 如 何 用 人 脑 寻 求解 法 ,然后 把 解 
法 写成 程序 ， 让 计算 机 照 着 执行 去 解决 问题 。 这 是 “经 典 算法 ”。 最 近 十 几 年 ， 随 着 Internet 产 业 
的 兴起 ,Internet 服 务 在 不 断 取代 原来 由 人 提供 的 服务 , 这 就 要 求 机 器 拥有 一 定 程度 上 能 取代 人 的 
“智能 ”。 在 搜索 引擎 、 推 荐 系统 和 广告 系统 等 各 个 领域 里 ， 类 似 上 述 “ 识 别 数字 ”的 问题 越 来 
越 多 , 而 人 工 智 能 和 机 器 学 习 的 应 用 也 越 来 越 深入 我 们 的 生活 。 机 器 学 习 算 法 的 设计 目标 和 “经 
典 算法 ”不 同一 一 不 是 让 人 来 想 解法 ,而 是 让 计算 机 从 数据 归纳 知识 一 一 有 了 这 些 知识 , 计算 机 
就 能 自己 寻求 解法 。 
虽然 经 典 算法 和 机 器 学 习 算法 之 间 的 差别 大 得 如 同一 场 革 命 , 但 是 由 经 典 而 人 机 器 学 习 的 过 
程 却 是 自然 而 然 的 。 比 如 《算法 的 乐趣 》 中 介绍 的 曲线 拟 合 问题 ， 就 是 supervised learning ( 有 监 
督学 习 ) ， 而 音乐 播放 需 里 常用 的 傅 里 叶 变 换 和 其 他 时 域 频 域 变换 则 是 unsupervised learning (无 
监督 学 习 ) 的 技术 基础 , 棋 类 游戏 算法 是 博弈 论 和 reinforcement learning ( 强化 学 习 ) 的 经 典 例子 。 
我 常见 有 朋友 从 读数 学 教材 开始 探索 机 咒 学 习 和 人 工 智能 算法 , 也 党 看 到 有 人 不 堪 忍 受 长 时 间 和 缺 
乏 乐 趣 的 探索 以 至 于 半途 而 废 。 如 果 是 这 样 ， 也 许 不 如 从 《算法 的 乐趣 》 开 始 这 个 探索 过 程 。 

我 曾经 以 为 从 乐趣 出 发 曾 述 算法 的 书 会 从 西方 发 芽 , 没 想到 先 看 到 了 一 本 中 文书 。 这 真 超出 
了 我 的 预料 。 


王 益 
LinkedIn 高 级 主任 分 析 师 


序 


当 图 灵 出 版 社 的 编辑 找到 我 希望 我 为 这 本 书写 个 序 的 时 候 , 我 和 旁边 的 同事 调侃 了 一 句 : 又 
一 本 简 版 的 《算法 导论 》 要 诞生 了 。 但 是 我 还 是 下 载 了 附件 阅读 了 这 本 书 ， 当 翻 到 目录 的 时 候 ， 
我 的 兴趣 就 被 燃 起 来 了 ， 转 头 和 同事 说 ， 也 许 这 是 一 本 不 错 的 书 。 

程序 员 到 底 需 不 需要 学 习 算 法 ? 这 个 问题 被 争论 的 次 数 绝 对 不 亚 于 “Java 是 不 是 最 好 的 语 

”“VIM 和 Emacs 谁 是 最 好 的 编辑 器 ” “程序 员 是 不 是 需要 学 习 数 学 "。 为 了 避免 陷 人 这 样 的 争论 


里 ， 我 们 先 对 “算法 ”一 词 做 个 转换 定义 ， 


什么 是 算法 ? 下 面 我 举 几 个 我 亲身 经 历 的 例子 。 


有 一 次 我 们 发 布 了 一 个 APP, 在 注册 时 要 求 用 户 输入 自己 的 真实 姓名 , 但 是 粗心 的 工程 师 忘 


记 了 要 求 用 户 填写 自己 的 性 别 ， 更 可 怜 的 是 在 欢迎 页 上 面 明 晃 晃 地 写 着 “欢迎 XXX 先生 注册 XX 


网 ”， 可 是 应 用 已 经 发 布 到 了 App Store， 到 


底 怎么 办 ? 有 一 位 工程 师 提 出 了 一 个 办 法 ， 我 们 根据 


已 有 的 用 户 姓名 和 性 别 作为 训练 集 , 来 预测 新 用 户 到 底 是 男 还 是 女 , 为 了 让 这 个 错误 尽快 得 到 修 


复 , 我 们 使 用 了 最 简单 的 朴素 贝 叶 斯 分 类 算法 ， 最终 测试 集 上 的 预测 准确 率 达 到 93%， 也 就 是 说 


我 们 解决 了 93% 用 户 的 体验 问题 。 我 把 这 类 算法 称 为 专业 类 算法 ,也 就 是 招聘 网 站 上 算法 工程 师 
要 求 的 算法 ， 例 如 图 像 处 理工 程 师 、 数 据 挖掘 工程 师 等 。 


有 一 次 我 们 有 一 个 相似 性 搜索 的 需求 ， 


数据 量 不 大 ,只 有 几 万 条 的 数据 记录 , 没有 必要 用 ES 


这 样 的 搜索 引擎 。 例 如 输入 “长 沙市 "， 也 希望 可 以 找到 “我 爱 湖南 长 沙 "“ 沙 市 小 吃 ” 等 ， 且 
不 说 这 个 需求 是 否 合理 , 我 们 单纯 来 讨论 这 个 问题 的 解决 方案 。 工程 师 实 现 的 第 一 版 是 将 所 有 字 
的 组 合 全 部 列举 出 来 ， 然 后 在 数据 库 里 做 lke 操 作 ， 性 能 无 法 接受 。 于 是 我 们 提出 了 男 一 种 解决 
方案 : 将 数据 库 中 的 每 个 词 都 拆 成 单字 ,做 成 集合 , 保存 在 缓存 中 。 接 下 来 只 需要 对 集合 做 交集 
操作 ， 以 字 为 单位 计算 词 与 词 之 间 的 相似 性 ,性 能 问题 一 下 就 解决 了 。 这 种 解 题 思 路 在 《编程 珠 
现 》 中 屡见不鲜 ,这 不 足以 称 为 具体 的 算法 ,几乎 都 是 在 梳理 我 们 的 逻辑 ， 训 练 我 们 解决 问题 的 
能 力 ， 我 把 这 类 算法 称 为 逻辑 类 算法 ,或 者 技巧 类 算法 。 


还 有 一 次 , 我 们 有 个 需求 是 帮助 用 户 做 旅游 的 行程 规划 ,其 中 的 情况 比较 复杂 ,因为 除了 地 
理 位 置 之 外 , 还 需要 包含 目的 地 的 过 往 用 户 评 价 、 所 需 耗 时 、 不 同城 市 的 住宿 花费 等 。 但 是 如 果 
我 们 仔细 分 析 ， 可 以 基于 产品 设计 去 拆 分 问题 。 在 在 线 部 分 , 我 们 可 以 去 使 用 基于 路 程 的 最 短 图 


路 径 算法 , 或 者 基于 价格 的 贪心 算法 , 也 可 


以 在 综合 排序 处 为 用 户 选择 使 用 了 变形 加 权 的 最 短 图 


路 径 算法 。 在 离线 部 分 , 由 于 图 的 节点 和 边 都 较 少 , 可 以 使 用 穷 举 法 来 为 用 户 找 到 几 种 不 同类 型 
的 最 优 解 。 这 些 算法 都 是 在 《算法 导论 》 和 《数据 结构 》 中 有 着 详细 讨论 的 算法 ， 书 中 的 每 一 个 
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算法 和 数据 结构 都 是 作者 多 年 来 抽象 总 结 出 的 通用 思路 ， 我 称 之 为 通用 类 算法 。 

再 说 一 个 最 基本 的 , 我们 做 一 个 网 站 允许 用 户 发 布 状态 ,在 高 峰 期 并 发 量 太 大 , 数据 库 不 堪 
重负 ， 所 以 我 们 需要 将 用 户 的 插入 记录 先 存 人 到 消息 队列 中 , 保证 用 户 的 正常 使 用 , 然后 再 落地 
到 MySQL 数 据 库 中 。 大 家 都 会 想到 选择 队列 这 样 一 种 先入 先 出 的 数据 结构 ， 这 也 属于 一 种 算法 。 

通过 上 面 的 几 个 例子 , 你 会 不 会 觉得 你 的 身边 处 处 都 是 算法 ? 那么 到 底 什么 是 算法 ? 我 们 看 
看 标准 的 定义 : 能 够 对 一 定 规范 的 输入 , 在 有 限时 间 内 获得 所 要 求 的 输出 的 一 系列 指令 都 叫 作 算 
法 。 这 个 定义 太 抽 象 了 ， 让 我 们 简单 来 说 , 算法 其 实 就 是 解决 问题 的 思路 和 办 法 。 那 么 从 这 一 点 
来 说 ， 你 还 会 说 算法 不 重要 么 ? 

那么 为 什么 还 会 有 很 多 学 生 , 甚至 已 经 工作 了 很 久 的 朋友 还 会 说 大 学 学 的 东西 没有 意义 , 算 
法 没有 用 呢 ? 归根 结 底 是 因为 大 家 不 知道 为 什么 学 , 或 者 说 缺乏 算法 的 场景 化 。 我 在 读 大 学 的 时 
候 ， 经 常 做 一 些 简单 的 网 站 , 用 到 的 技术 无 外 乎 是 最 简单 的 对 数据 库 的 增删 改 查 ， 当 时 最 大 的 感 
觉 就 是 算法 没有 用 。 后 来 随 着 工作 的 深入 ,我 开始 逐步 地 意识 到 算法 的 重要 性 , 逐渐 地 把 算法 捡 
了 起 来 。 

这 本 书 给 我 最 大 的 惊喜 是 没有 像 一 般 的 算法 书 一 样 单纯 地 去 讲 算法 和 数据 结构 本 身 , 那样 无 
论语 言 多 风趣 ， 只 要 一 谈 到 关键 的 问题 也 会 马上 变 得 无 趣 起 来 。 作 者 在 每 一 章 都 给 出 了 一 个 实际 
的 问题 , 然后 尝试 用 算法 去 解决 这 一 个 问题 , 没有 局 限于 通用 类 算法 , 而 是 同时 涵盖 逻辑 类 算法 、 
通用 类 算法 和 专业 类 算法 ,真正 是 在 训练 读者 解决 问题 的 能 力 ， 而 解决 问题 的 能 力 , 正 是 任何 一 
家 公司 所 需 人 才 的 最 核心 的 技能 。 

另外 , 我 已 经 在 幻想 作者 在 下 一 本 书 里 可 以 把 工作 中 的 实际 场景 列举 出 来 , 更 进一步 地 讲述 
工作 中 的 算法 , 让 每 一 个 在 校 学 生 都 可 以 意识 到 算法 对 于 未 来 工作 的 重要 性 , 也 让 每 一 位 从 业者 
拍案 叫绝 :“ 原 来 这 个 问题 可 以 这 样 解 !” 让 人 人 谈 算 法 ， 人 人 写 算 法 ， 引 发 软件 行业 的 全 民 算 
法 潮 。 


黄 愈 ( 飞 林 沙 ) 
极光 推送 首席 科学 家 
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如 果 说 《 啊 哈 ! 算法 》 是 算法 界 的 小 白 书 ， 内 容 太 少 看 得 不 过 净 ， 那 么 这 本 《算法 的 乐趣 》 
或 许可 以 带 你 一 起 牛 通 一 起 飞 。 当 我 刚 拿 到 书 的 目录 的 时 候 , 我 就 很 期 待 ， 因 为 终于 有 一 本 算法 
书 可 以 系统 地 和 大 伙 说 一 说 这 些 我 也 很 想 与 大 伙 说 的 伟大 算法 。 

暴力 盲目 的 搜索 算法 往往 让 计算 机 显得 很 笨 甚 至 有 点 痴呆 ， 如 果 你 想 设 计 一 个 “ 狭 独 ”的 程 
序 ， 那 么 本 书 中 的 搜索 剪 枝 、A* 寻 径 、 博 弈 树 以 及 遗传 算法 等 将 给 你 带 来 启发 。 快 速 传 里 叶 变 
换 ， 这 么 霸气 而 又 高 大 上 的 名 字 ， 其 实在 我 们 生活 中 的 应 用 随处 可 见 ， 家 中 的 Wi-Fi、 智 能 手机 、 
电话 、 路 由 器 等 几乎 所 有 内 置 计算 机 系统 的 东西 都 会 以 各 种 方式 使 用 这 个 算法 。RLE 数 据 压 缩 算 
法 ,在 文档 、 视 频 、 音 乐 、 数 据 存储 、 云 计算 、 数 据 库 等 几乎 所 有 应 用 中 都 有 着 广泛 的 运用 。 压 
缩 算法 令 系 统 更 有 效 , 成 本 更 低 。 再 来 说 密码 学 算法 中 非常 重要 的 RSA 算 法 , 如 果 没 有 这 些 算法 ， 
互联 网 就 会 变 得 不 安全 ， 电 子 交 易 就 不 会 如 此 可 信 。 

好 玩 的 算法 还 有 很 多 很 多 ， 历 法 与 二 十 四 节气 的 计算 、 华 容 道 、 间 字 棋 、 黑 白 棋 、 五 子 棋 以 
及 俄罗斯 方块 …… 你 会 惊讶 地 发 现 , 再 简单 不 过 的 事情 背后 ， 都 藏 着 算法 的 神奇 背影 。 不 妨 将 本 
书 放 在 案头 慢 慢 品 读 ， 你 将 能 看 到 算法 如 何 深 入 我 们 的 日 常生 活 ， 如 何 重 塑 我 们 的 世界 。 

你 准备 好 了 吗 ? 接 下 来 ， 这 个 世界 算法 将 接管 一 切 。 


咱 哈 天 
《 啊 哈 ! 算法 》 作 者 


致谢 


本 书 的 示例 和 思考 来 源 于 我 多 年 的 资料 收集 和 面试 题目 , 旨 在 通过 现实 生活 中 的 有 趣 实例 揭 
示 算 法 的 作用 。 本 书 来 源 于 我 博客 中 的 算法 专栏 , 在 写作 的 过 程 中 , 很 多 人 给 予 了 我 无 私 的 帮助 ， 
在 此 我 要 向 所 有 帮助 过 我 的 人 致 以 诚挚 的 感谢 。 

首先 ， 感 谢 我 的 家 人 给 予 的 无 条 件 的 支持 ， 没 有 他 们 的 理解 和 鼓励 ， 本 书 将 无 法 按时 完稿 。 

其 次 , 感谢 图 灵 的 各 位 编辑 老师 在 本 书 策划 和 编写 过 程 中 给 予 的 指导 和 帮助 , 感谢 本 书 的 排 
版 老师 让 书 中 的 图 表 更 加 清晰 和 规范 ， 感 谢 封面 设计 师 潘 建 永和 书签 设计 师 Sneezry， 你 们 非 几 
的 创意 和 优秀 的 设计 让 这 本 书 锦上添花 。 感 谢 王 益 、 黄 多 和 纪 舌 对 本 书 的 认同 和 推荐 。 

最 后 , 我 要 感谢 本 书 参考 资料 的 所 有 作者 , 我 已 经 尽力 寻找 所 有 资料 的 引用 根源 , 但 是 仍 有 
可 能 漏 掉 一 些 内 容 ， 对 于 没有 提 到 的 名 字 的 作者 ， 我 感到 十 分 抱歉 ， 但 是 仍然 要 感谢 你 们 。 


ll 


前 


程序 员 与 算法 , 这 是 一 个 永恒 的 话题 ,无 论 在 哪个 论坛 ， 只 要 出 现 此 类 主题 的 帖子 , 一 定 会 
看 到 两 种 针锋相对 的 观点 的 “激烈 碰撞 "。 其 实 泡 过 论坛 的 人 都 知道 ， 两 种 观点 “激烈 辩论 ”的 
惨烈 程度 往往 可 以 上 升 到 互相 问候 先 人 的 高 度 ， 即 使 是 技术 论坛 也 不 例外 。 在 准备 此 书 之 前 , 我 
在 博客 的 “算法 系列 ”专栏 已 经 陆 陆 续 续 地 写 了 有 一 年 多 的 时 间 ， 在 此 期 间 ， 不 断 有 读者 问 我 : 
“程序 员 必 须 会 算法 吗 ? ”我 实在 不 想 让 我 的 博客 成 为 距 满 各 种 口水 的 是 非 之 地 ， 所 以 一 般 不 正 
面 回 答 ， 只 是 笼统 地 说 些 “ 各 行 各 业 情 况 都 不 尽 相 同 ”之 类 的 话 ， 避 免 站 队 。 

程序 员 对 算法 通常 怀 有 复杂 的 感情 , 算法 很 重要 是 大 家 的 共识 , 但 是 是 否 每 个 程序 员 都 必须 
学 算法 是 主要 的 分 歧 点 。 本 书 是 想 重新 定义 程序 员 对 算法 的 理解 , 并 不 想 通 过 说 教 的 方式 给 出 到 底 
是 学 还 是 不 学 的 结论 。 很 多 人 可 能 觉得 像 人 工 智能 、 视 频 与 音频 处 理 以 及 数据 搜索 与 挖掘 这 样 高 大 
上 的 内 容 才 能 称 为 算法 , 往往 觉得 算法 深 不 可 测 。 但 是 这 些 其 实 都 不 是 具体 的 算法 , 而 是 一 系列 算 
法 的 集合 , 这 里 面 既 有 各 种 大 名 瞻 瞻 的 算法 ， 比 如 神经 网 络 、 遗 传 算法 、 离 散 傅 里 叶 变换 算法 以 及 
各 种 插值 算法 ,也 有 不 起 眼 的 排序 和 概率 计算 的 算法 。 你 必须 深入 地 了 解 它们 , 才 会 领略 到 算法 的 
实质 一 一 解决 问题 。 忽 视 这 一 点 ， 片 面 地 或 抽象 地 理解 算法 ， 就 会 使 对 算法 的 理解 变 得 形而上学 。 
在 我 的 博客 里 就 有 人 留言 质疑 :“ 穷 举 也 算是 算法 ? ” 且 不 说 搜索 和 枚 举 是 算法 的 基础 设计 模式 之 
一 , 单 就 那么 多 的 NPC 问 题 ( 比如 著名 的 汉密尔顿 回路 问题 , 至 今 还 没有 找到 多 项 式 时 间 的 算法 )， 
实际 上 ， 从 只 有 穷 举 算法 和 其 他 随机 搜索 算法 才能 求解 这 一 点 看 ， 任 何人 都 不 能 小 看 它 。 

狭隘 的 算法 定义 会 将 自己 局 限 在 一 个 小 角落 里 , 从 而 错过 了 整个 色彩 缤纷 的 算法 世界 。 本 书 
将 带 你 开启 一 段 算法 之 旅 , 在 这 里 , 你 将 会 看 到 各 种 构造 算法 的 基础 方法 ,比如 贪 禁 法 、 分 治 法 、 
动态 规划 法 ,等 等 ,也 可 以 通过 一 个 个 示例 看 到 如 何 应 用 这 些 算法 来 解决 实际 问题 。 通过 对 “ 爱 
白 坦 的 思考 题 ”“ 三 个 水 桶 等 分 水 ”“ 妖 怪 与 和 尚 过 河 问 题 ” 等 趣味 智力 题 的 计算 机 求解 算法 设 
计 , 你 可 以 领会 到 算法 设计 的 三 个 关键 问题 ,以 及 对 这 些 问 题 的 处 理 方法 , 为 以 后 解决 这 样 的 问 
题 提供 举一反三 的 基础 。 

在 生活 中 , 凡是 有 乐趣 的 地 方 就 有 算法 。 本 书 将 介绍 生活 中 无 处 不 在 的 算法 。 在 历法 计算 的 
章节 里 ， 你 会 看 到 霍 纳 法 则 (Homer's rule ) 的 使 用 和 求解 一 元 高 次 方程 的 牛顿 迭代 法 ; 音频 播 
放 带 上 跳动 的 频谱 ， 背后 是 离散 傅 里 叶 变 换算 法 ; DOS 时 代 著 名 的 PCX 图 像 文件 格式 使 用 的 RLE 
压缩 算法 是 如 此 简单 , 但 是 却 非常 有 效 ; RSA 加 密 算 法 的 光环 之 下 是 朴实 的 欧 几 里 得 算法 、 蒙 哥 
马 利 算法 和 米 勒 - 拉 宾 算法 ; 华容 道 游戏 求解 的 简单 穷 举 算法 中 还 蕴藏 着 对 棋盘 状态 的 哈 希 算 
法 …… 遗 传 算法 神秘 不 可 测 ， 但 是 用 遗传 算法 求解 0-1 背 包 问 题 只 用 了 60 多 行 代 码 。 事 实 上 ， 抛 
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开 对 遗传 算法 的 深层 次 研究 和 在 各 种 专业 领域 内 的 扩展 应 用 , 单 就 算法 原理 来 说 , 它 就 是 3 
单 。 深蓝 战 胜 卡 斯 特 罗 之 后 ， 人 类 棋 手 在 与 计算 机 的 博 穿 中 就 完全 处 于 下 风 ， 人 工 智 能 么 
神奇 ? 人 工 智 能 确实 是 个 神奇 的 领域 , 但 就 计算 机 下 横 这 件 事 来 说 ， 却 并 不 怎么 神奇 , 算法 的 基 
本 原理 简单 得 让 人 难以 置信 ， 看 看 第 23 章 你 就 知道 了 。 

算法 之 大 , 大 到 可 以 者 括 宇宙 万 物 的 运行 规律 , 算法 之 小 ,小 到 寥寥 数 行 代码 即 可 展现 一 个 
神奇 的 功能 。 算 法 是 琐碎 的 ， 以 至 于 常常 被 人 们 忽视 ,然而 忽视 算法 能 力 的 培养 所 带 来 的 代价 
巨大 的 ， 第 1 章 介绍 的 环形 队列 的 例子 就 是 一 个 最 好 的 说 明 。 我 面试 过 很 多 求职 者 ， 我 常常 会 让 
也 们 手写 一 个 算法 , 我 的 题目 是 这 样 的 : 有 一 个 由 若干 正 整 数组 成 的 数列 ， 数列 中 的 每 个 数 都 不 
超过 32, 已 知 数列 中 存在 重复 的 数字 , 请 给 出 一 个 算法 找 出 这 个 数列 中 所 有 重复 出 现 的 数 。 我 期 
望 求职 者 给 我 一 个 正确 的 算法 实现 , 接 下 来 我 会 问 这 个 算法 的 时 间 复 杂 度 是 什么 , 有 没有 考虑 过 
存在 一 个 O(n) 时 间 复 杂 度 的 算法 。 大 部 分 求职 者 都 知道 自己 的 算法 是 O(n ) 时 间 复杂 度 , 但 是 都 否 
认 存 在 O(n) 时 间 复 杂 度 的 算法 。 事 实 上 这 个 题目 是 可 以 有 O(n) 时 间 复 杂 度 的 算法 的 ， 因 为 大 家 都 
忽略 了 一 个 重要 的 条 件 。 这 个 题目 并 不 难 , 但 是 仍 有 将 近 三 分 之 一 的 面试 者 无 法 给 出 正确 的 算法 ， 
有 的 甚至 还 给 我 一 张 白 纸 。 有 人 犯错 误 是 正常 现象 , 但 是 让 我 意外 的 是 居然 有 三 分 之 一 的 人 写 不 
出 这 个 算法 ， 算 法 设计 的 基本 功 被 无 视 到 这 种 地 步 是 不 正常 的 。 
程序 员 谈 到 算法 言 必 称 一 些 高 大 上 的 词汇 , 但 是 这 些 专 有 名 词 大 部 分 人 是 用 不 到 的 ， 以 至 于 
人 们 和 常常 认为 算法 不 过 如 此 ， 不 会 又 如 何 ? 这 种 思想 变 得 极端 就 会 让 人 忽视 算法 的 基础 设计 能 
力 , 这 才 是 最 要 命 的 。 在 我 们 维护 的 网 络 设备 上 ， 用 户 的 数据 关系 错综复杂 ,一 个 对 线性 表 进 行 
二 重 循环 都 想不到 的 人 又 怎么 可 能 会 维护 这 些 数据 ? 我 希望 程序 员 们 提高 基础 的 算法 能 力 , 先 从 
音 养 兴趣 开始 或 许 是 一 个 不 错 的 切 人 点 。 

本 书 挑选 的 算法 例子 ,都 围绕 着 “ 趣 ” 字 展开 ， 都 是 简单 且 在 生活 中 常见 的 算法 ， 可 能 有 些 
是 你 还 没有 意识 到 的 。 我 上 学 的 时 候 曾经 做 过 一 个 MP3 播 放 器 程序 , 你 可 能 觉得 这 主要 就 是 利用 
一 些 音频 解码 算法 吧 ? 是 的 , 这 个 是 主要 部 分 , 但 是 一 个 功能 完整 的 播放 程序 还 用 了 很 多 你 想 不 
到 的 算法 : 为 增加 频谱 显示 和 均衡 器 功能 ， 使 用 了 离散 傅 里 时 变换 算法 ; 为 计算 频率 功率 谱 , 使 
用 了 加 权 平 均值 算法 ; 为 了 匹配 硬件 输出 设备 与 解码 算法 的 性 能 差异 , 需要 一 个 有 多 个 缓冲 区 的 
队列 管理 音频 数据 块 ， 这 就 引入 了 滑动 窗口 算法 ; 为 提供 按照 专辑 名 称 或 作者 名 称 排序 功能 , 使 
用 了 快速 排序 算法 ; 为 了 平滑 均衡 器 调节 对 音频 的 影响 , 使 用 了 三 次 样 条 曲线 插值 算法 ; 为 了 在 
两 首 歌曲 之 间 切 换 时 压制 刺耳 的 杂音 (通过 填充 一 些 舒 适 噪 声 的 方式 实现 )， 还 使 用 了 正弦 信号 
发 生 需 算法 。 这 些 你 都 没有 想到 吧 ? 其 实 还 有 更 多 的 例子 ,比如 大 型 项 目 管理 软件 中 的 工作 节点 
排序 功能 和 关键 路 径 功 能 , 背后 支撑 它们 的 却 是 简单 的 有 向 图 拓扑 排序 算法 。 这 是 不 是 很 有 趣 ? 
生活 中 处 处 都 是 算法 ， 程 序 员 又 怎么 可 能 与 算法 绝缘 ? 

再 次 重申 一 点 ,本 书 没 有 任何 关于 算法 重要 性 的 说 教 ， 当 你 看 到 本 书 时 , 我 希望 你 的 表情 是 
“ 啊 哈 ， 原 来 如 此 !1”, 或 者 是 “ 嗯 ， 有 意思 !”， 并 从 中 获得 乐趣 。 本 书 几 乎 所 有 章节 都 有 相关 算 
法 实现 和 功能 演示 的 代码 , 读者 可 以 到 我 的 博客 (http:/blog.csdn.netorbit ) 中 下 载 , 也 可 以 到 图 
灵 社 区 本 书 主页 (www.iTuring.cn/book/1605 ) 下 载 使 用 。 
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本 章 的 标题 既然 是 “程序 员 与 算法 ”， 就 必然 要 涉及 一 个 基本 问题 ， 那 就 是 “程序 员 是 否 必 
须 会 算法 ”。 这 是 一 个 充满 争议 的 问题 ， 虽 然 并 不 像 “ 生 存 还 是 毁灭 ”之 类 的 选择 那样 艰难 而 沉 
重 , 但 也 绝 不 是 一 个 轻松 的 话题 。 朋 友 们 在 我 的 “算法 系列 ”博客 专栏 上 发 表 的 评论 和 回复 ,并 
不 都 是 我 所 期 竺 的 赞美 和 鼓励 , 也 常常 会 有 一 些 冷 言 冷 语 。 比 如 ,“ 穷 举 也 算是 算法 吗 ” 或 者 “请 
你 说 明 一 下 算法 在 XX 系统 中 能 起 到 什么 作用 ”。 


有 一 次 ， 一 个 网 友 通过 邮件 问 我 :“ 你 写 的 都 是 小 儿科 的 东西 ， 几 十 行 代码 就 能 搞定 ， 能 不 
能 整 一 点 高 深 的 算法 ? ”我 反问 他 什么 是 他 所 理解 的 高 深 的 算法 ， 他 答复 说 :“ 像 遗传 算法 、 蚁 
群 算法 之 类 的 。 于 是 我 给 了 他 一 个 遗传 算法 求解 0-1 背包 问题 的 例子 ( 参见 第 16 章 )， 并 告诉 
他 , 这 也 就 是 几 十 行 代码 的 算法 ,怎么 理解 成 是 高 深 的 算法 ?他 刚 开始 不 承认 这 是 遗传 算法 , 直 
到 我 给 了 他 Denis Cormier 公开 在 北 卡 罗 来 纳 州立 大 学 服务 器 上 的 遗传 算法 的 源 代 码 后 ， 他 才 相 
信 他 一 直 认 为 深 不 可 测 的 遗传 算法 的 原理 原来 是 这 么 简单 。 

还 有 一 个 网 友 直 言 我 写 的 “用 三 个 水 桶 等 分 8 升水 ”之 类 的 问题 根本 就 称 不 上 算法 ,他 认为 
像 “深蓝 ”那样 的 人 工 智能 才 算是 算法 。 我 告诉 他 计算 机 下 棋 的 基本 理论 就 是 博弈 树 ， 或 者 再 加 
一 个 专家 系统 。 但 是 他 认为 博弈 树 也 是 很 高 深 的 算法 ， 于 是 我 给 了 他 一 个 井 字 棋 游戏 ( 参见 第 
23 章 )， 并 告诉 他 ， 这 就 是 博弈 树 搜 索 算法 ， 非 常 智能 ， 你 绝对 战胜 不 了 它 〈 因为 井 字 棋 游 戏 很 
简单 ， 这 个 算法 会 把 所 有 的 状态 都 搜索 完 )。 我 相信 他 一 定 很 震惊 ， 因 为 这 个 算法 也 不 超过 100 
行 代码 。 

对 于 上 面 提 到 的 例子 , 我 觉得 主要 原因 在 于 大 家 对 算法 的 理解 有 差异 , 很 多 人 对 算法 的 理解 
太 片 面 ， 很 多 人 觉得 只 有 名 字 里 包 含 “XX 算法 ”之 类 的 东西 才 是 算法 。 而 我 认为 算法 的 本 质 是 
解决 问题 ， 只 要 是 能 解决 问题 的 代码 就 是 算法 。 在 讨论 程序 员 与 算法 这 个 问题 之 前 ,我 们 先 探 讨 
一 个 最 基本 的 问题 : 什么 是 算法 。 
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1.1 什么 是 算法 


《算法 导论 》 一 书 将 算法 (algorithm ) 描述 为 定义 良好 的 计算 过 程 ， 它 取 一 个 或 一 组 值 作为 
输入 , 并 产生 一 个 或 一 组 值 作为 输出 。Knuth 在 《计算 机 程序 设计 艺术 》 一 书 中 将 算法 描述 为 从 
一 个 步骤 开始 ， 按 照 既 定 的 顺序 执行 完 所 有 的 步骤， 最 终结 束 〈 得 到 结果 ) 的 一 个 过 程 。Weiss 
在 《数据 结构 与 算法 分 析 》 一 书 中 将 算法 描述 为 一 系列 的 计算 步 又， 将 输入 数据 转换 成 输出 的 
结果 。 
虽然 没有 被 普遍 接受 的 “算法 ”的 正式 定义 , 但 是 各 种 著作 中 对 算法 的 基本 要 素 或 基本 特征 
的 定义 都 是 明确 的 ，Knuth 总 结 了 算法 的 四 大 特征 。 
口 确定 性 。 算 法 的 每 个 步骤 都 是 明确 的 ， 对 结果 的 预期 也 是 确定 的 。 

口 有 穷 性 。 算 法 必须 是 由 有 限 个 步骤 组 成 的 过 程 ， 步 又 的 数量 可 能 是 几 个 ， 也 可 能 是 几 百 

万 个 ， 但 是 必须 有 一 个 确定 的 结束 条 件 。 

口 可 行 性 。 一 般 来 说 ， 我 们 期 望 算 法 最 后 得 出 的 是 正确 的 结果 ， 这 意味 着 算法 中 的 每 一 个 
步骤 都 是 可 行 的 。 只 要 有 一 个 步骤 不 可 行 ， 算 法 就 是 失败 的 ， 或 者 不 能 被 称 为 某 种 算法 。 

口 输入 和 输出 。 算 法 总 是 要 解决 特定 的 问题 ， 问 题 来 源 就 是 算法 的 输入 ， 期 望 的 结果 就 是 
算法 的 输出 。 没 有 输入 的 算法 是 没有 意义 的 ， 没 有 输出 的 算法 是 没有 用 的 。 

算法 需要 一 定 的 数学 基础 , 但 是 没有 任何 文献 资料 将 算法 限定 于 只 解决 数学 问题 。 有 些 人 将 
贪 林 法、 分 治 法 、 动 态 规划 法 、 线 性 规划 法 、 搜 索 和 枚 举 ( 包括 穷 尽 枚 举 ) 等 方法 理解 为 算法 ， 
其 实 这 些 只 是 设计 算法 常用 的 设计 模式 ( Knuth 称 之 为 设计 范式 )。 同 样 ， 计 算 机 程序 只 是 算法 
的 一 种 存在 形式 , 伪 代 码 、 流 程 图 、 各 种 符号 和 控制 表格 也 是 常见 的 算法 展示 形式 。 而 顺序 执行 、 
并 行 执行 (包括 分 布 式 计算 )、 递 归 方法 和 和 迭代 方法 则 是 常用 的 算法 实现 方法 。 

综合 以 上 分 析 和 引述 , 本 人 将 算法 定义 为 : 算法 是 为 解决 一 个 特定 的 问题 而 精心 设计 的 一 套 
数学 模型 以 及 在 这 套数 学 模型 上 的 一 系列 操作 步骤 ,这些 操作 步骤 将 问题 描述 的 输入 数据 逐步 处 
理 、 转 换 ， 并 最 后 得 到 一 个 确定 的 结果 。 使 用 “精心 设计 ”一 词 ， 是 因为 我 将 算法 的 设计 过 程 理 
解 为 人 类 头脑 中 知识 、 经 验 激烈 碰撞 的 过 程 ， 将 算法 理解 为 最 终 "小 宇宙 爆发 ”一 般 得 到 的 智力 
结果 。 


1.2 程序 员 必 须要 会 算法 吗 


很 多 人 可 能 是 好 莱 坞 大 片 看 多 了 ,以 为 计算 机 神通 广大 , 但 事实 不 是 这 样 的 。 计 算 机 其 实 是 
一 种 很 僚 的 工具 ， 傻 到 几乎 没有 智商 〈 至 少 目前 是 这 样 )。 它 可 以 连续 几 年 做 同一 件 事情 而 毫 无 
怨言 , 但 是 如 果 你 不 告诉 它 怎么 做 ， 它 什么 事情 也 不 会 做 。 最 有 创造 性 的 活动 其 实 是 由 一 种 被 称 
为 “程序 员 ” 的 人 做 的 ， 计 算 机 做 的 只 不 过 是 人 类 不 愿意 做 的 体力 活 而 已 。 比 如 图 像 识 别 技术 ， 
需要 一 个 字 节 一 个 字 节 地 处 理 数据 ,提取 数据 的 特征 值 ， 然 后 在 海量 的 数据 中 比较 、 匹 配 这 些 特 
征 值 ， 直到 累 得 两 眼 开 花 ， 人 类 才 不 会 干 这 种 傻 事 儿 呢 。 计 算 机 愿意 做 ， 但 前 提 是 你 要 告诉 它 怎 
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么 做 。 算法 可 以 理解 为 这 样 一 种 技术 ，, 它 将 告诉 计算 机 怎么 做 。 有 人 将 编程 理解 为 搭 积 木 ， 直 接 
用 别人 开发 好 的 组 件 、 库 ， 甚 至 是 类 或 API 就 行 了 ， 并 日 美 其 名 日 “不 用 重复 发 明 轮 子 ”。 我 认 
为 这 其 实 就 是 所 谓 的 系统 集成 , 如 果 一 个 程序 员 每 天 的 工作 就 是 搭 积 木 , 那 将 是 令 人 十 分 类 慕 的 
事情 , 但 是 我 知道 , 事实 并 不 是 这 样 的 。 这 样 搭 积木 式 的 编程 计算 机 就 可 以 做 , 没有 必要 让 人 来 
做 ， 因 为 人 工 的 成 本 高 于 计算 机 。 我 遇 到 的 更 多 的 是 在 论坛 里 发 帖 求助 的 人 ， 比 如 “ 求 代 码 ,把 
一 个 固定 格式 的 文本 文件 读 人 内 存 ”， 再 比如 “ 谁 能 帮 有 我 把 这 个 结构 数组 排 排序 啊 ， 书 上 的 例子 
都 是 整数 数组 排序 "”。 他 们 是 如 此 地 无 助 ， 如 果 不 是 论坛 对 回帖 有 积分 奖励 的 话 ， 下 ， 怕 不 会 有 人 
理 他 们 。 
我 要 说 的 是 , 大 多 数 程序 员 并 不 需要 知道 各 种 专业 领域 里 的 算法 , 但 是 你 要 会 设计 能 够 解决 
你 面临 问题 的 算法 。 一 些 领 域内 的 经 典 问题 , 在 前 人 的 努力 之 下 都 有 了 高 效 的 算法 实现 , 本 书 的 
很 多 章节 都 介绍 了 这 样 的 算法 ， 比 如 稳定 匹配 问题 、A* 算 法 等 。 但 是 更 多 情况 下 ， 你 所 面临 的 
问题 并 没有 现成 的 算法 实现 ， 需 要 程序 员 具 有 创新 的 精神 。 算 法 设计 需要 具备 很 好 的 数学 基础 ， 
但 数学 并 不 是 唯一 需要 的 知识 ， 计 算 机 技术 的 一 些 基 础 学 科 ( 比如 数据 结构 ) 也 是 必需 的 知识 ， 
有 人 说 : 程序 = 算法 + 数据 结构 ， 这 个 虽然 不 完全 正确 ， 但 是 提 到 了 计算 机 程序 最 重要 的 两 点 ， 
那 就 是 算法 和 数据 结构 。 算 法 和 数据 结构 永远 是 紧密 联系 在 一 起 的 , 算法 可 以 理解 为 解决 问题 的 
思想 ,这 是 程序 中 最 具有 创造 性 的 部 分 , 也 是 一 个 程序 有 别 于 另 一 个 程序 的 关键 点 ， 而 数据 结构 
就 是 这 种 思想 的 载体 。 
再 次 重申 一 遍 ， 我 和 大 多 数 人 一 样 ， 并 不 是 要 求 每 个 程序 员 都 精通 各 种 算法 。 大 多 数 程序 员 
可 能 在 整个 职业 生涯 中 都 不 会 遇 到 像 ACM (Association for Computing Machinery ) 组 织 的 国际 大 
学 生 程序 设计 竞赛 中 的 问题 , 但 是 说 用 不 到 数据 结构 和 算法 则 是 不 可 想象 的 。 说 数据 结构 和 算法 
没 用 的 人 是 因为 他 们 用 不 到 , 用 不 到 的 原因 是 他 们 想不到 , 而 想不到 的 原因 是 他 们 不 会 。 请 息 怒 ， 
我 不 是 要 打击 任何 人 ， 很 多 情况 下 确实 是 因为 不 会 ， 所 以 才 用 不 到 ， 下 面 就 是 一 个 典型 的 例子 。 


1.2.1 一 个 队列 引发 的 惨案 


我 所 在 的 团队 负责 一 款 光 接 和 人 网 产品 的 “EPON 业务 管理 模块 ”的 开发 和 维护 工作 ， 这 是 电 
信 级 的 网 络 设备 ， 因 此 对 各 方面 性 能 的 要 求 都 非常 高 。 有 一 天 , 一 个 负责 集成 测试 的 小 伙 儿 跑 过 
来 对 我 说 , 今天 的 每 日 构造 版 本 出 现 异常 ， 所 有 线 卡 ( 承载 数据 业务 的 板 卡 ) 的 上 线 时 间 比 昨天 
的 版 本 慢 了 4 分 钟 左 右 。 我 很 惊讶 ， 对 于 一 个 电信 级 网 络 设备 来 说 ， 每 次 加 电 后 的 线 卡 上 线 时 间 
就 是 业务 恢复 时 间 , 业务 恢复 时 间 这 么 慢 是 不 能 接受 的 。 于 是 我 检查 了 一 下 前 一 天 的 代码 和 人 库 记 
录 , 很 快 就 找到 了 问题 所 在 。 原 来 当前 版 本 的 任务 列表 中 有 这 样 一 项 功能 , 那 就 是 记录 线 卡 的 数 
据 变 更 日 志 , 需求 的 描述 是 在 线 卡 上 维护 一 个 日 志 缓 冲 区 , 每 当 有 用 户 操 作 造成 数据 变更 时 ,就 
记录 一 条 变更 信息 , 线 卡 上 线 时 的 批量 数据 同步 也 属于 操作 数据 变更 , 也 要 计 入 日 志 。 因 为 是 般 
人 和信 式 设备 , 线 卡 上 日 志 缓 冲 区 的 大 小 受 限制 , 最 多 只 能 存储 1000 条 记录 , 当 记 录 的 日 志 超 过 1000 
条 时 ， 新 增 的 日 志 记 录 将 覆盖 旧 的 记录 ， 也 就 是 说 ， 这 个 日 志 缓 冲 区 只 保留 最 近 写 人 的 1000 条 
记录 ,一 个 新 来 的 小 伙 儿 接受 了 这 个 任务 , 并 在 前 一 天 下 班 前 将 代码 签 人 库 中 ( 程序 员 要 记 住 啊 ， 
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一 定 不 要 在 临 下 班 前 签 入 代码 )。 他 的 实现 方案 大 致 是 这 样 的 ( 注释 是 我 加 上 的 ): 


#define SYNC LOG CNT 1000 
#define SYNC LOG MEMOVER CNT 50 


typedef struct 

INT32U logCnt; 

EPON_SYNC_ LOG DATA syncLogs[SYNC LOG CNT]; 
}EPON_SYNC_ LOG; 
EPON SYNC LOG s_ EponSyncLog; 


void Epon Sync Log Add(EPON SYNC LOG DATA*pLogData) 


{ 
INT32U i = 0; 
INT32U syncLogCnt = 0; 
syncLogCnt = s_EponSyncLog.logCnt; 
if(syncLogCnt>=SYNC_LOG CNT) 
/# 缓 冲 区 已 满 ， 向 前 移动 950 条 记录 ， 为 新 纪录 腾 出 50 条 记录 的 空间 */ 
memmove(S_EponSyncLog .syncLogs， 
s_EponSyncLog.syncLogs + SYNC LOG MEMOVER CNT, 
(SYNC LOG CNT-SYNC LOG MEMOVER CNT) * sizeof(EPON SYNC LOG DATA)); 
/* 清 空 新 腾 出 来 的 空间 */ 
memset(s_ EponSyncLog.syncLogs + (SYNC LOG CNT - SYNC LOG MEMOVER CNT), 
0, SYNC LOG MEMOVER CNT * sizeof(EPON SYNC LOG DATA)); 
/* 写 入 当前 一 条 上 日志 */ 
memmove(s_EponSyncLog.syncLogs + (SYNC LOG CNT - SYNC LOG MEMOVER CNT), 
pLogData, sizeof(EPON SYNC LOG DATA)); 
s_EponSyncLog.logCnt = SYNC LOG CNT - SYNC LOG MEMOVER CNT + 1; 
return; 
} 


/* 如 果 缓 冲 区 有 空间 ， 则 直接 写 入 当前 一 条 记录 */ 
memmove(s_EponSyncLog.syncLogs + SyncLogCnt， 
pLogData, sizeof(EPON SYNC LOG DATA)); 
s_EponSyncLog.1logCnt++; 


这 个 方案 使 用 一 个 长 度 为 1000 条 记录 的 数组 存储 日 志 ， 用 一 个 计数 器 记录 当前 写 入 的 有 效 
日 志 条 数 ， 数据 结构 的 设计 中 规 中 和 矩 , 但 是 当 缓 冲 区 满 , 需要 覆盖 旧 记 录 时 遇 到 了 麻烦 ， 因 为 每 
次 都 要 移动 数组 中 的 前 999 条 记录 ， 才 能 为 新 记录 腾 出 空间 ， 这 将 使 Epon_Sync_Log_Add() 函 数 的 
性 能 急剧 恶化 。 考 虑 到 这 一 点 ， 小 伙 儿 为 他 的 方案 设计 了 一 个 冰 值 ， 就 是 SYNC_LOG MEMOVER_CNT 
常量 定义 的 50。 当 缓冲 区 满 的 时 候 ， 就 一 次 性 向 前 移动 950 条 记录 ， 腾 出 50 条 记录 的 空间 ， 避 
免 了 每 新 增 一 条 记录 就 要 移动 全 部 数据 的 情况 。 可 见 这 个 小 伙 儿 还 是 动 了 一 番 脑 子 的 ， 在 
Epon_Sync_Log_Add() 函 数 调用 不 是 很 频繁 的 情况 下 ， 在 功能 和 性 能 之 间 做 了 个 折 中 ， 根 据 自 测 的 
情况 ,他 觉得 还 可 以 , 于 是 就 在 下 班 前 匆匆 签 入 代码 , 没有 来 得 及 安排 代码 走 查 和 同行 评审 。 但 
是 他 没有 考虑 到 线 卡 上 线 时 需要 批量 同步 数据 的 情况 ， 在 这 种 情况 下 ，Epon_sync_Log_Add() 函 数 
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被 调用 的 频 度 仍然 超出 了 这 个 阔 值 所 能 容忍 的 程度 。 通 过 对 任务 的 性 能 进行 分 析 , 我 们 发 现 大 量 
的 时 间 都 花费 在 Epon_sync_Log Add() 函数 中 移动 记录 的 操作 上 ， 即 便 是 设计 了 阅 值 
SYNC_LOG_MEMOVER_CNT， 性 能 依然 很 差 。 

其 实 ， 类 似 这 样 的 固定 长 度 缓冲 区 的 读 写 ， 环 形 队 
列 通 常 是 最 好 的 选择 。 下 面 我 们 来 看 一 下 环形 队列 的 示 
图 ， 如 图 1-1 所 示 。 ; 
计算 机 内 存 中 没有 环形 结构 ， 因 此 环形 队列 都 是 用 
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线性 表 来 实现 的 ， 当 数据 指针 到 这 线性 表 的 尾部 时 ,就 aaaZNO 
将 它 转 到 0 位 置 重新 开始 。 实 际 编程 的 时 候 ， 也 不 需要 aa SA 
每 次 都 判断 数据 指针 是 否 到 达 线 性 表 的 尾部 , 通常 用 到 @ ; 
模 运算 对 此 做 一 致 性 处 理 。 设 模拟 环形 队列 的 线性 表 的 
长 度 是 N， 队 头 指针 为 head， 队 尾 指针 为 tail， 则 每 增 
加 一 条 记录 ， 就 可 用 以 下 方法 计算 新 的 队 尾 指针 ; 
tail = (tail + 1) %N 

对 于 本 例 的 功能 需求 ， 当 tail + 1 等 于 head 的 时 候 ， 说 明 队列 已 满 ， 此 时 只 需 将 head 指针 
向 前 移动 一 位 ， 就 可 以 在 tail 位 置 写 入 新 的 记录 。 使 用 环形 队列 ， 可 以 避免 移动 记录 操作 ， 本 
节 开始 时 提 到 的 性 能 问题 就 迎刃而解 了 。 在 这 里 , 套用 一 句 广告 词 :“ 没 有 做 不 到 , 只 有 想不到 。” 
看 看 ， 我 没 说 错 吧 ? 
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我 的 第 一 份 工作 是 为 一 个 光栅 图 像 矢量 化 软件 编写 一 个 图 像 预 处 理 系 统 , 这 套 光栅 图 像 矢 量 
化 软件 能 够 将 从 纸 质 工程 图 纸 扫 描 得 到 的 位 图 图 纸 识别 成 能 被 各 种 CAD 软件 处 理 的 矢量 化 图 形 
文件 。 在 预 处 理 系 统 中 有 一 个 功能 是 对 已 经 二 值 化 的 光栅 位 图 ( 黑白 两 色 位 图 ) 进行 污点 消除 。 
光栅 位 图 上 的 污点 可 能 是 原始 图 纸 上 扫 描 前 就 存在 的 墨 点 , 也 可 能 是 扫描 仪 引入 的 噪点 , 这 些 污 
点 会 对 矢量 化 识别 过 程 产生 影响 ,会 识别 出 错误 的 图 形 和 符号 ， 因 此 需要 预先 消除 这 些 污 点 。 

当时 我 不 知道 有 小 波 算 法 ,也 不 知道 还 有 各 种 图 像 滤波 算法 ,只 是 根据 对 问题 的 认识 , 给 出 
了 我 的 解决 方案 。 首 先 我 观察 图 纸 文件 ， 像 直线 、 圆 和 弧 线 这 样 有 意义 的 图 形 都 是 最 少 有 5 个 点 
相互 连 在 一 起 构成 的 , 而 污点 一 般 都 不 会 超过 5 个 点 连 在 一 起 ( 较 大 的 污点 都 用 其 他 的 方法 除 掉 
了 ) 因此 我 给 出 了 污点 的 定义 : 如 果 一 个 点 周围 与 之 相连 的 点 的 总 数 小 于 5， 则 这 儿 个 相连 在 
一 起 的 点 就 是 一 个 污点 。 根 据 这 个 定义 ,我 给 出 了 我 的 算法 : 从 位 图 的 第 一 个 点 开始 搜索 ， 如 果 
这 个 点 是 1 (1 表示 黑色 ， 是 图 纸 上 的 点 ; 0 表示 日 色 ， 是 图 纸 背 景 颜色 )， 就 将 相连 点 计数 融 加 
1， 然 后 继续 向 这 个 点 相连 的 8 个 方向 分 别 搜索 ， 如 果 某 个 方向 上 的 相 邻 点 是 0 就 停止 这 个 方向 
的 搜索 。 如 果 搜 索 到 的 相连 点 超过 4 个 ， 说 明 这 个 点 是 某 个 图 形 上 的 点 ， 就 退出 这 个 点 的 搜索 。 
如 果 搜 索 完成 后 得 到 的 相连 的 点 小 于 或 等 于 4 个 ,就 说 明 这 个 点 是 一 个 污点 , 需要 将 其 颜色 置 为 
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0 ( 清除 污点 )。 
算法 实现 首先 定义 搜索 过 程 中 存储 相连 点 信息 的 数据 结构 ， 这 个 数据 结构 定义 如 下 : 
typedef struct tagRESULT 
POINT pts[MAX_DIRTY_POINT];/* 记 录 搜 索 过 的 前 5 个 点 的 位 置 */ 


int count; 
}RESULT; 


这 个 数据 结构 有 两 个 属性 ，count 是 搜索 过 程 中 发 现 的 相连 点 的 个 数 ，pts 是 记录 这 些 相连 点 
位 置 的 线性 表 。 记 录 这 些 点 的 位 置 是 为 了 在 搜索 结束 后 ， 如 果 判 定 这 些 点 是 污点 ， 可 以 利用 这 些 
记录 的 位 置信 息 直接 清除 这 些 点 的 颜色 。 


/*8 个 方向 */ 
POINT dir[] ™ ‘ 攻读 0}, {1 -1}, {0, a} fy -1}, 二 0}, {1， 3 {0, 1}, {-1, 1} } 


void SearchDirty(char bmp[MAX BMP WIDTH] [MAX BMP_ HEIGHT] 
int x, int y, RESULT *result) 
{ 
for(int i = 0; i «< sizeof(dir)/sizeof(dir[0]); i++) 
{ 
int nx = x + dir[i].x; 
int ny = y + dir[i].y; 
if( (nx >= 0 && nx < MAX BMP WIDTH) 
&& (ny >= 0 8& ny < MAX_ BMP_HEIGHT) 
8& (bmp[nxj[ny] == 1) ) 


if(result->count < MAX DIRTY POINT) 


/* 记 录 前 MAX_DIRTY_POINT 个 点 的 位 置 */ 
result->pts[result->count].x = nx; 
result->pts[result->count].y = ny; 
} 
result->count++; 
if(result->count > MAX_DIRTY_POINT) 
break; 


SearchDirty(bmp, nx, ny, result); 
} 
} 
} 


向 8 个 方向 搜索 使 用 了 预 置 的 矢量 数组 dir， 这 是 迷宫 或 棋盘 类 游戏 搜索 惯用 的 模式 ， 本 书 
介绍 的 算法 会 多 次 使 用 这 种 模式 。SearchDirty() 函 数 递归 地 调用 自己 ,实现 对 8 个 方向 的 连通 性 
搜索 ， 最 后 的 结果 存在 result 中 ， 如 果 count 的 个 数 大 于 4， 说 明 [x，y] 位 置 的 点 是 正常 图 形 上 
的 点 ， 如 果 count 的 个 数 小 于 或 等 于 4， 则 说 明 [x,y] 位 置 相 邻 的 这 个 点 是 一 个 污点 。 污 点 相 邻 
的 点 的 位 置 都 被 记录 在 pts 中 , 将 这 些 位 置 的 位 图 数据 置 0 就 消除 了 污点 。 算 法 没有 做 任何 优化 ， 
不 过 好 在 图 纸 上 大 部 分 都 是 白色 背景 ,需要 搜索 的 点 并 不 多 。 打 开 测 试图 纸 一 试 ， 速 度 并 不 慢 ， 
效果 也 很 好 , 几 个 故意 点 上 去 做 测试 用 的 污点 都 没有 了 , 小 的 噪点 也 没有 了 , 图 纸 一 下 就 变 白 了 。 
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不 过 这 段 代码 最 终 并 没有 成 为 那个 软件 的 一 部 分 , 学 过 机 械 制 图 的 同学 可 能 看 出 来 了 , 这 个 算法 | 
会 将 一 些 细小 的 虚线 和 点 划 线 一 并 干掉 。 
这 是 一 个 微不足道 的 问题 ， 但 却 是 我 第 一 次 为 解决 ( 当然 ， 未遂 ) 问题 而 设计 了 一 个 算法 ， 
并 最 终 用 程序 将 其 实现 。 它 让 我 领悟 到 了 一 个 道理 ,软件 被 编写 出 来 就 是 为 了 解决 问题 的 ,程序 
员 的 任务 就 是 设计 解决 这 些 问题 的 算法 。 成 功 固然 高 兴 , 失败 也 没有 什么 代价 ,可 以 随时 卷 土 重 
来 。 不 要 小 看 这 些 事情 , 不 要 以 为 只 有 各 种 专业 领域 的 程序 才 会 用 到 算法 ,每 一 个 微小 的 设计 都 
是 算法 创造 性 的 体现 ， 即 使 失败 ， 也 比 放弃 强 。 
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算法 有 很 多 种 存在 形式 , 编写 计算 机 程序 只 是 其 中 一 种 ,是 程序 员 惯 用 的 方式 ,本 书 要 介绍 
的 内 容 就 是 如 何以 计算 机 程序 的 方式 研究 算法 。1.2 节 介 绍 的 两 个 例子 都 是 我 亲身 经 历 过 的 事情 ， 
程序 员 在 大 部 分 时 间 里 都 是 处 理 一 些 平凡 而 琐碎 的 程序 ， 但 有 时 候 也 需要 做 一 些 创造 性 的 工作 。 
记 住 ,程序 员 就 是 计算 机 的 “上 帝 ”"， 计 算 机 能 解决 问题 是 因为 它 的 “上 帝 ” 告 诉 它 怎 么 做 。 那 
么 ， 当 问题 来 临 的 时 候 , “上 帝 ” 是 到 各 种 论坛 上 发 帖子 求 代码 ， 还 是 自己 解决 问题 ? 

如 果 要 自己 解决 问题 ， 应 该 如 何 解决 问题 ?为 什么 要 自己 解决 问题 ? 先 来 回答 第 一 个 问 
题 一 一 如 何 设计 算法 解决 问题 ”人 类 解决 问题 的 方式 是 当 遇 到 一 个 问题 时 ,首先 从 大 脑 中 搜索 
已 有 的 知识 和 经 验 ， 寻 找 它们 之 间 具 有 关联 的 地 方 ， 将 一 个 未 知 问题 做 适当 的 转换 ， 转 化 成 
一 个 或 多 个 已 知 问题 进行 求解 ， 最 后 综合 起 来 得 到 原始 问题 的 解决 方案 。 编 写 计算 机 程序 实 
现 算法 ， 让 计算 机 帮 我 们 解决 问题 的 过 程 也 不 例外 ， 也 需要 一 定 的 知识 和 经 验 。 为 了 让 计算 
机 帮 我 们 解决 问题 ， 就 要 设计 计算 机 能 理解 的 算法 程序 。 而 设计 算法 程序 的 第 一 步 就 是 要 让 
计算 机 理解 问题 是 什么 。 这 就 需要 建立 现实 问题 的 数学 模型 。 建 模 过 程 就 是 一 个 对 现实 问题 
的 抽象 过 程 ， 运 用 逻辑 思维 能 力 ， 抓 住 问题 的 主要 因素 ， 忽 略 次 要 因素 。 建 立 数学 模型 之 后 ， 
第 二 个 要 考虑 的 问题 就 是 输入 输出 问题 ， 输 入 就 是 将 自然 语言 或 人 类 能 够 理解 的 其 他 表达 方 
式 描述 的 问题 转换 为 数学 模型 中 的 数据 ， 输 出 就 是 将 数学 模型 中 表达 的 运算 结果 转换 成 自然 
语言 或 人 类 能 够 理解 的 其 他 表达 方式 。 最 后 就 是 算法 的 设计 ， 其 实 就 是 设计 一 套 对 数学 模型 
中 的 数据 的 操作 和 转换 步骤 ， 使 其 能 演化 出 最 终 的 结果 。 

数学 模型 、 输 入 输出 方法 和 算法 步骤 是 编写 计算 机 算法 程序 的 三 大 关键 因素 。 对 于 非常 复杂 
的 问题 ， 建 立 数学 模型 是 非常 难 的 事情 ， 比 如 天 文物 理学 家 研究 的 “宇宙 大 爆炸 ”模型 ， 再 比如 
热力 学 研究 的 复杂 几何 体 冷却 模型 ， 等 等 。 不 过 ， 这 不 是 本 书 探讨 的 范围 ,程序 员 遇 到 的 问题 更 
多 的 不 是 这 种 复杂 的 理论 问题 ， 而 是 软件 开发 过 程 中 常用 和 常见 的 问题 ， 这 些 问 题 简单 , 但 并 不 
枯燥 乏味 。 对 于 简单 的 计算 机 算法 而 言 ， 建 立 数学 模型 实际 上 就 是 设计 合适 的 数据 结构 的 问题 。 
这 又 引出 了 前 面 提 到 的 话题 , 数据 结构 在 算法 设计 过 程 中 扮演 着 非常 重要 的 角色 。 输入 输出 方式 
和 算法 步骤 设计 都 是 基于 相应 的 数据 结构 设计 的 , 相应 的 数据 结构 要 能 很 方便 地 将 原始 问题 转换 
成 数据 结构 中 的 各 个 属性 , 也 要 能 很 方便 地 将 数据 结构 中 的 结果 以 人 们 能 够 理解 的 方式 输出 , 同 
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时 ,也 要 为 算法 转换 过 程 中 各 个 步骤 的 演化 提供 最 便利 的 支持 。 使 用 线性 表 还 是 关联 结构 , 使 用 
树 还 是 图 ， 都 是 在 设计 输入 输出 和 算法 步骤 时 就 要 考虑 的 问题 。 

为 什么 要 自己 解决 问题 ? 爱 因 斯 坦 说 过 :“ 兴 趣 是 最 好 的 老师 。” 这 就 是 说 , 只 要 一 个 人 对 菜 
事物 产生 兴趣 ， 就 会 主动 去 学 习 、 去 研究 ， 并 在 学 习 和 研究 的 过 程 中 产生 愉快 的 情绪 。 我 把 从 算 
法 中 体会 到 的 乐趣 分 成 三 个 层次 : 初级 层次 是 找到 特定 的 算法 解决 特定 的 实际 问题 , 这 种 乐趣 是 
解决 问题 后 的 成 就 感 ; 中 级 层次 是 有 些 算 法 本 身 就 是 充满 乐趣 的 , 搞 明白 这 种 算法 的 原理 并 写 出 
算法 的 程序 代码 , 能 为 自己 今后 的 工作 带 来 便利 ; 高 级 层次 是 自己 设计 算法 解决 问题 , 让 其 他 人 
可 以 利用 你 的 算法 享受 到 初级 层次 的 乐趣 。 有 了 时候 问题 可 能 是 别人 没有 遇 到 过 的 , 没有 已 知 的 解 
法 ,这 种 情况 下 只 能 自己 解决 问题 。 这 是 本 书 一 直 强 调 算法 的 乐趣 的 原因 。 只 有 体会 到 乐趣 ， 才 
有 动力 去 学 习 和 研究 , 而 这 种 学 习 和 研究 的 结果 是 为 自己 带 来 正 向 的 激励 , 为 今后 的 工作 带 来 便 
利 。 回 想 一 下 1.2.1 节 的 例子 ,环形 队列 相关 的 算法 是 固定 长 度 缓冲 区 读 写 的 常用 模式 ， 如 有 果 知 
道 这 一 点 ， 就 不 会 有 这 种 问题 了 。 


1.4 算法 与 代码 


本 书 讲 到 的 算法 都 是 以 计算 机 程序 作为 载体 展示 的 , 其 基本 形式 就 是 程序 代码 。 作 为 一 个 软 
件 开 发 人 员 ， 你 希望 看 到 什么 样 的 代码 ?是 这 样 的 代码 : 
double kg = gScale * 102.1 + 55.3; 
otifyModule1(kk); 
double kl1 = kg / 1 mask; 
otifyModule2(k11); 
double kl2 = kg * 1.25 / 1 mask; 
otifyModule2(k12); 
还 是 这 样 的 代码 : 
double globalKerp = GetGlobalKerp(); 
otifyGlobalModule(globalKerp); 
double localkrep = globalkerp / localMask; 
otifyLocalModule(localkrep); 


double localKTepBoost = globalKerp * 1.25 / localMask; 
otifyLocalModule(localkrepBoost); 


程序 员 都 有 一 种 直觉 那 就 是 能 看 懂 的 代码 就 是 好 代码 。 但 是 “能 看 懂 ” 是 一 个 非常 主观 的 
感觉 ,同样 的 代码 给 不 同 的 人 看 ， 能 否 看 懂 有 着 天 壤 之 别 。《 重 构 》 一 书 的 作者 为 不 好 的 代码 总 
结 了 21 条 “ 坏 味 道 ”规律 ， 和 希望 能 够 对 号 入 座 地 判断 一 下 代码 中 的 “ 坏 代码 ”。 但 是 这 21 条 规 
律 仍然 太 主 观 , 于 是 人 们 又 给 代码 制定 了 很 多 量化 指标 ， 比 如 代码 注释 率 ( 这 个 指标 因为 没有 意 
义 , 已 经 被 很 多 组 织 抛弃 了 )、 平 均 源 代码 文件 长 度 、 平 均 函 数 长 度 、 平 均 代码 依赖 度 、 代 码 赔 
套 深度 、 测 试用 例 覆 盖 度 ,等 等 。 做 这 些 工 作 的 目的 在 于 人 们 希望 看 到 漂亮 的 代码 ， 这 不 仅仅 是 
主观 审美 的 需要 ,更 是 客观 上 对 软件 质量 的 不 懈 追 求 。 漂 亮 的 代码 有 助 于 改善 软件 的 质量 , 这 已 
经 是 公认 的 事实 , 因为 程序 员 在 把 他 们 的 代码 变 得 漂亮 的 过 程 中 , 能 够 通过 一 些 细小 却 又 重要 的 
方式 改善 代码 的 质量 , 这 些 细 小 却 又 重要 的 方式 包括 但 不 限于 更 好 的 设计 、 可 测试 性 和 可 维护 性 
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等 方面 的 方法 。 [ 量 
在 保证 软件 行为 正确 性 的 基础 上 ， 人 们 都 用 什么 词 来 形容 好 的 代码 呢 ? 好 看 、 漂 亮 、 整 洁 、 

优雅 、 艺 术 品 、 像 诗 一 样 ? 我 看 过 很 多 软件 的 代码 ， 有 开源 软件 的 代码 ， 也 有 商业 软件 的 代码 ， 

好 的 代码 给 我 的 感觉 就 是 以 上 这 些 形容 词 , 当然 也 见 过 不 好 的 代码 , 给 我 的 感觉 就 是 “一 堆 代码 ” 

而 已 。 我 在 写 “ 算 法 系列 ”博客 专栏 的 时 候 ， 就 特别 注意 这 一 点 ， 即 便 别 人 已 经 发 布 过 类 似 的 算 

法 实现 , 我 也 希望 我 的 算法 呈现 出 来 的 是 完全 不 一 样 的 代码 。 设 计算 法 也 和 设计 软件 一 样 ,应 该 

是 漂亮 的 代码 ， 如 果 几 百 行 代码 堆 在 一 起 ,不 分 主 次 ,关系 凌乱 ， 只 是 最 后 堆 出 了 一 个 正确 的 结 

果 ， 这 不 是 我 所 希望 的 代码 ， 既 虐 人 又 虐 己 。 大 部 分 人 来 看 你 的 博客 ， 应 该 还 是 为 了 看 懂 吧 。 在 

我 准备 这 本 书 的 时 候 ， 我 把 很 多 算法 又 重新 写 了 一 遍 ， 不 仅 算 法 有 趣 ， 人 研究 代码 也 是 一 种 乐趣 。 

如 果 算 法 本 身 很 有 趣 ， 但 是 最 后 的 代码 实现 却 是 毫 无 美感 的 “一 堆 代 码 ”， 那 真是 大 扫兴 了 。 


1.5 总 结 

本 章 借用 了 多 部 知名 著作 中 对 算法 的 定义 , 只 是 想 让 大 家 对 算法 有 一 个 “宽容 ”一 点 的 理解 。 
通过 我 亲身 经 历 的 两 个 例子 ， 说 明了 程序 员 与 算法 之 间 “ 剪 不 断 ， 理 还 乱 ” 的 关系 。 除 此 之 外 ， 
还 简单 探讨 了 算法 乐趣 的 来 源 、 算 法 和 代码 的 关系 ， 以 及 研究 代码 本 身 的 乐趣 等 内 容 。 

如 果 你 认同 我 的 观点 ， 就 可 以 继续 阅读 本 书 了 。 本 书 的 每 一 章 都 是 独立 的 ， 没 有 前 后 关系 ， 
你 可 以 根据 自己 的 喜好 直接 阅读 相关 的 章节 。 和 希望 本 书 能 使 你 有 所 收获 ， 并 体会 到 算法 的 乐趣 。 
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第 思 章 
算法 设计 的 基 仙 


看 到 这 里 ， 说 明 你 对 算法 设计 感 兴趣 。 编 写 程序 开发 软件 是 冒险 者 的 游戏 ， 需 要 胆 大 心细 ， 
设计 一 个 解决 实际 问题 的 算法 尤其 如 此 。 现 实 问题 复杂 多 样 ， 对 应 的 算法 也 是 复杂 多 样 , 形态 各 
异 , 但 是 这 些 算法 都 遵循 一 些 特定 的 方法 和 模式 。 就 算法 模式 而 言 ， 处 理 各 种 求 最 优 解 问题 时 ， 
人 们 常用 贪 焚 法 、 动 态 规划 法 等 算法 模式 ; 处 理 迷 宫 类 问题 时 , 穷尽 式 的 枚 举 和 回溯 是 常用 的 模 
式 。 就 算法 的 实现 方法 而 言 ， 如 果 算 法 需要 频繁 地 查 表 操 作 , 那么 数据 结构 的 设计 通常 会 选择 有 
序 表 来 实现 ; 反 过 来 ， 当 设计 的 算法 用 到 了 树 和 图 这 样 的 数据 结构 时 ,含有 递归 结构 的 方法 就 常 
常 伴随 它们 左右 。 

算法 设计 是 个 复杂 的 内 容 , 单 就 这 个 话题 就 可 以 写 一 本 书 了 。 克 林 伯 格 的 《算法 设计 》 就 是 
一 本 这 样 的 书 , 掌握 了 算法 设计 的 基本 内 容 之 后 ,就 可 以 去 哺 《 算 法 导论 》 或 其 他 各 种 欧 赛 类 算 
法 的 书 了 , 但 这 都 不 是 本 书 的 重点 。 本 书 的 目的 是 展示 算法 的 有 趣 之 处 , 希望 通过 一 些 简 单 有 趣 
的 算法 改变 程序 员 对 算法 的 固有 印象 , 我 们 不 去 研究 那些 各 个 行业 领域 内 的 复杂 算法 ,只 来 讨论 
一 些 通用 的 、 共 性 的 东西 。 


2.1 程序 的 基本 结构 


从 大 的 方面 来 考量 算法 问题 ， 相 对 于 并 行 算法 ,本 书 介绍 的 都 是 串 行 算法 的 设计 方法 。 按 照 
冯 ，… 诺 依 曼 计 算 机 体系 的 设计 ， 计算机 的 CPU 每 次 只 能 串 行 执行 一 条 指令 ， 即 使 那些 号 称 支 持 
多 线程 的 操作 系统 ， 其 实际 效果 也 是 “宏观 上 并 行 ， 微观 上 串 行 "。 顺 序 执行 、 循 环 和 分 支 跳 转 
是 程序 设计 的 三 大 基本 结构 ， 算 法 也 是 程序 ， 千 姿 百 态 的 算法 也 是 由 这 三 大 基础 结构 构成 的 。 


2.1.1 顺序 执行 

顺序 执行 是 算法 的 基础 结构 , 循环 体 结构 的 每 个 循环 体内 也 是 顺序 执行 的 , 分 支 和 跳 转 的 每 
个 分 支 内 也 是 顺序 执行 的 。 假 如 算法 中 某 个 操作 需要 几 个 步骤 完成 ,每 个 步骤 都 依赖 于 前 一 个 步 
又 , 将 前 一 个 步骤 的 输出 作为 下 一 个 步骤 的 输入 ， 中 间 不 能 打 断 和 调整 顺序 ， 这 样 的 结构 就 是 算 
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法 的 顺序 执行 结构 (如 图 2-1 所 示 )。 


图 2-1 顺序 执行 结构 图 


以 雇员 工资 打印 算法 为 例 ,必须 先 统计 出 雇员 的 出 勤 情况 ， 然 后 才能 计算 工资 最 后 才能 打 
印 工资 单 ， 这 三 个 步 又 顺序 不 能 打 乱 ， 否 则 将 无 法 得 到 正确 的 结果 。 第 11 章 中 计算 太阳 的 地 心 
视 黄 经 算法 ， 需 要 计算 出 平 黄 经 ， 然 后 修正 地 心 章 动 ， 修 正 交角 章 动 ， 修 正光 行 差 ,最 后 得 到 地 
心 视 黄 经 。 其 中 修正 地 心 章 动 、 修 正 交角 章 动 和 修正 光 行 差 这 三 个 步 又 是 对 平 黄 经 值 的 修正 , 没 
有 前 后 关系 ， 可 以 互 换 顺 序 ， 虽 然 算法 实现 是 顺序 方式 ， 但 是 它们 不 是 严格 的 顺序 执行 结构 。 
顺序 执行 结构 虽然 简单 ,但 是 却 具有 重要 的 意义 。 算 法 的 基本 特征 之 一 就 是 确定 性 ， 因 此 算 
法 里 的 顺序 结构 必须 是 明确 的 , 其 结果 是 不 变 的 。 除了 确定 性 , 顺序 执行 结构 还 具有 封闭 性 特征 ， 
也 就 是 说 ， 无 论 上 一 步 的 结果 如 何 ， 都 会 继续 执行 下 一 步 ， 不 受 外 部 条 件 和 内 部 因素 的 影响 。 


2.1.2 ”循环 结构 


循环 结构 也 是 算法 中 一 种 很 重要 的 控制 流程 , 循环 被 定义 为 在 算法 中 只 出 现 一 次 但 是 却 有 可 
能 被 执行 多 次 的 一 段 逻 辑 体 。 从 实际 应 用 角度 看 ,稍微 复杂 一 点 的 算法 都 会 用 到 循环 结构 。 循 环 
结构 一 般 由 三 部 分 组 成 : 循环 初始 化 、 循 环 体 和 循环 条 件 ( 退出 条 件 )。 循 环 初始 化 部 分 一 般 做 
些 循环 体 控 制 状态 的 初始 化 工作 , 包括 循环 条 件 的 初始 化 。 循环 体 可 以 是 顺序 执行 结构 ， 也 可 以 
人 带 有 分 支 跳 转 结构 ， 甚 至 可 以 是 个 循环 体 〈 多 重 循环 结构 )。 循 环 条 件 可 以 是 简单 的 计数 器 ， 也 
可 以 是 复杂 的 逻辑 判断 , 它 定义 循环 的 执行 条 件 或 退出 条 件 。 有 少数 编程 语言 提供 一 些 特殊 的 指 
令 , 可 以 控制 循环 结构 的 流程 和 退出 ， 比 如 C 语 言 的 continue 和 break 语句 ,但 是 这 种 控制 方式 
不 具备 算法 通用 性 。 

从 数据 结构 方面 看 , 涉及 线性 表 的 遍历 和 查找 操作 , 一 般 都 会 用 到 循环 结构 ， 比 如 多 项 式 求 
和 算法 和 各 种 排序 算法 。 维基 百科 的 “算法 ”条 目 给 出 了 一 个 求 最 大 数 的 例子 , 其 算法 实现 如 下 : 


int max(int *values, int size) 


int mval = *values; 
int i; 
for(i = 1; i «< size; i++) 
if(values[i] > mval) 
mval = values[i]; 
} 


return mval; 
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for 语句 块 的 代码 就 是 C 语 言 形式 的 循环 结构 ， 循 环 条 件 是 i < size。 

关于 循环 也 有 很 多 有 趣 的 话题 。 举 个 例子 ， 如 果 算 法 操作 的 数据 结构 是 二 维 数组 , 通常 都 会 
用 到 两 重 循环 ， 但 是 也 可 以 用 单 循环 遍历 二 维 数组 ， 第 19 童 介绍 数 独 游戏 的 解法 的 时 候 ， 对 小 
九宫 格 的 遍历 就 多 次 使 用 了 这 种 技巧 ， 比 如 初始 化 一 个 小 九宫 格 的 代码 可 能 是 这 样 的 : 


for(int i = 0; i < 9; i+t+) 


{ 


int row = i / 3; 
int col = i % 3; 
game->cells[row][col].fixed = false; 


只 要 介绍 循环 ， 就 不 得 不 提 递 归 ， 一 些 文献 资料 将 递归 作为 一 种 独立 的 程序 控制 方法 介绍 ， 
但 是 更 多 的 资料 将 递归 看 作 是 循环 的 一 种 替代 形式 。 这 两 种 形式 看 起 来 差异 很 大 , 但 是 本 质 都 是 
一 样 的 ,递归 结构 通常 都 可 以 用 复杂 一 点 的 循环 形式 代替 ,特别 是 尾 递归 形式 ， 可 以 直接 替换 成 
循环 结构 。 递 归结 构 一 般 由 递归 关系 定义 和 递归 终止 条 件 两 部 分 组 成 ,递归 关系 定义 就 是 对 问题 
的 分 解 ,是 指向 递归 终止 条 件 转化 的 规则 ， 而 递归 终止 条 件 通常 就 是 问题 分 解 到 最 小 规模 时 ， 这 
个 最 小 规模 的 问题 对 应 的 结果 。 递 归 方 法 符合 人 类 思考 问题 的 方式 ， 它 可 以 使 算法 结构 简单 ,过 
程 简洁 。 对 于 树 和 图 这 样 的 数据 结构 , 递归 方法 更 是 具有 循环 形式 无 法 比拟 的 优势 ,下 面 给 出 了 
FindTNode() 函数 递归 方式 实现 的 二 又 树 查 找 算法 ， 大 家 可 以 体会 一 下 递归 的 优美 。 


bool FindTNode(TNODE *tr, int key) 
{ 


if(tr == NULL) 


if(tr->key == key) 


if(key < tr->key) 
return FindTNode(tr->left, key); 


return FindTNode(tr->right, key); 


尾 递 归 是 尾 调用 "的 一 种 特殊 情况 ， 也 是 递归 结构 的 一 种 特殊 形式 。 编 译 吉 一 般 都 可 以 对 尾 
递归 进行 优化 〈 尾 调用 消除 技术 )， 直 接 利 用 当前 函数 的 栈 帧 ， 将 尾 调用 处 理 成 循环 的 形式 。 实 
际 上 ， 即 便 不 使 用 编译 圳 的 优化 , 尾 递归 也 可 以 很 容易 转化 成 循环 形式 。 前文 给 出 的 FindTNode() 
函数 其 实 就 是 尾 递 归 ， 可 以 很 容易 将 其 转化 成 循环 形式 ， 代 码 如 下 所 未 : 


bool FindTNode(TNODE *tr, int key) 


TNODE *curNode = tr; 
while(curNode != NULL) 


{ 
if(curNode->key == key) 


GD 尾 调 用 是 指 一 个 函数 里 的 最 后 一 个 动作 是 调用 一 个 函数 的 情形 , 这 个 函数 调用 的 返回 值 直接 被 当前 函数 作为 返回 值 。 
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return true; 


if(key < curNode->key) 
curNode = curNode->left; 
else 
curNode = curNode->right,; 


} 


return false; 


递归 结构 使 用 的 函数 递归 调用 , 会 增加 任务 的 栈 空间 使 用 , 用 递归 方法 解决 问题 的 规模 受 系 
统 栈 空间 的 约束 ， 除 此 之 外 ， 苑 数 调用 时 的 参数 入 栈 和 出 栈 也 会 降低 算法 的 效率 。 


2.1.3” 分支 和 跳 转 结构 


顺序 结构 可 以 解决 计算 、 输 入 和 输出 等 问题 , 但 是 不 能 作 判断 和 选择 。 现 实生 活 中 的 很 多 问 
题 都 需要 进行 判断 和 选择 ,处理 这 些 问题 ,关键 在 于 对 条 件 的 判断 。 分 支 和 跳 转 结构 在 程序 中 扮 
演 着 重要 的 角色 ， 正 是 由 于 有 了 分 支 和 跳 转 ， 程 序 才能 够 产生 多 种 多 样 的 结果 。 算 法 设计 也 离 不 
开 分 支 和 跳 转 结构 ， 根 据 对 条 件 的 判断 ， 选 择 合适 的 处 理 步骤， 是 算法 实现 过 程 中 常用 的 逻辑 。 
分 支 和 跳 转 结构 算法 设计 的 关键 是 设计 分 支 条 件 和 算法 的 跳 转 流 程 , 一 般 一 个 分 支 条 件 对 应 一 个 
处 理 流程 。 算 法 在 执行 的 过 程 中 , 根据 构造 的 分 支 条 件 进行 判断 , 根据 判断 的 结果 转 人 相应 的 处 
理 流 程 继 续 执 行 。 

根据 跳 转 分 支 的 个 数 ， 分 支 结构 又 可 细 分 为 单 分 支 结构 、 双 分 支 结构 、 崔 套 分 支 结构 和 多 分 
支 结构 (switch-case 结构 )。 单 分 支 结构 一 般 可 表示 为 : 


if( 条 件 ) 


分 支流 程 


} 

根据 分 支 条 件 的 判断 结果 , {} 内 的 分 支流 程 可 能 被 执行 , 也 可 能 不 被 执行 。 从 算法 构造 的 角度 
看 ， 单 分 支 结构 多 被 用 在 根据 条 件 判 断 ， 需 要 在 正常 处 理 流程 中 插入 一 些 特 殊 处 理 的 情况 。 比 如 ， 
计算 一 年 有 多 少 天 ， 如 果 是 闽 年 就 需要 额外 多 加 一 天 ， 就 可 以 采用 单 分 支 结构 ， 代 码 如 下 所 示 : 


int days_per year = 365; 
if(((year % 4 == 0) 8&& (year % 100 != 0)) || (year % 400 == 0)) 
{ 


days_per year += 1; 


return days_per year; 

双 分 支 结构 适合 那 种 非 “ 真 ” 即 “ 假 ” 的 流程 处 理 ， 两 个 分 支 为 互 斥 流程 ， 执 行 一 个 分 支 就 
必然 不 会 执行 男 一 个 分 支 。 双 分 支 结构 一 般 可 表示 为 : 

if( 条 件 ) 

{ 


分 支流 程 1 
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分 支流 程 1 和 分 支流 程 2 是 根据 条 件 互 斥 执行 的 。 单 分 支 结构 有 时 候 可 以 看 作 是 双 分 支 结构 
的 一 种 特殊 情况 ， 即 分 支流 程 2 是 空 的 情况 。 

当 某 个 条 件 分 支 的 处 理 流程 中 又 包含 分 支 条 件 时 ,就 构成 通 套 分 支 结构 , 组 套 分 支 结构 可 以 
表示 为 : 


if( 条 件 1) 


if( 条 件 2) 
{ 


当 算法 的 某 个 流程 处 理 存在 多 级 条 件 判断 的 时 候 , 就 会 用 上 髓 套 分 支 结构 , 但 是 过 深 的 能 套 分 
支 结构 会 使 得 算法 代码 条 理 不 清楚 ,降低 代码 的 可 读 性 。 一 般 虞 套 分 支 结 构 不 要 超过 三 层 , 否则 的 
话 就 要 考虑 调整 算法 , 或 者 用 函数 封装 替换 分 支 代码 ,以 提高 算法 代码 的 可 读 性 。 对 于 简单 条 件 的 
多 层 符 套 ， 可 以 使 用 组 合 条 件 来 避免 多 层 分 支 衣 套 ， 比 如 前 面 的 两 层 嵌 套 结 构 就 可 以 调整 为 : 

if( 条 件 1 88 条 件 2) 

{ 


当 算 法 的 某 个 步骤 需要 多 重 筛选 条 件 时 ， 就 会 用 到 多 分 支 结构 ， 多 分 支 结 构 可 以 表示 为 : 


if( 条 件 1) 
{ 


分 支流 程 1 


} 
else if( 条 件 2) 
{ 


和 双 分 支 结构 一 样 ,多 分 支 结 构 的 每 个 分 支流 程 也 是 互 斥 执行 的 。 生活 中 有 很 多 情况 都 不 是 
非 真 即 假 的 两 种 选择 ， 因 此 多 分 支 结构 在 算法 中 也 经 常用 到 ， 比 如 给 学 生 打 评语 的 算法 ,就 需要 
根据 分 数 的 区 间 将 评语 定位 为 “优秀 ”"、“ 优 良 ”、“ 良 好 ”、“ 及 格 ”"， 等 等 。 有 一 些 编程 语言 提供 
了 类 似 于 switch-case 的 结构 ， 可 以 在 某 些 情况 下 蔡 换 多 分 文 结构 。switch-case 结构 的 优点 是 对 
分 支 条 件 只 进行 一 次 判断 就 可 以 决定 代码 的 分 支流 程 , 避免 多 次 判断 分 支 条 件 , 但 是 缺点 就 是 不 
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能 进行 复杂 的 条 件 判断 ， 比 如 C 语言 的 switch-case 结构 ， 其 分 支 判 断 条 件 就 只 支持 整数 类 型 的 
常量 表达 式 。 

过 长 的 多 分 支 结 构 常 被 视 为 软件 中 的 不 良 结 构 , 因为 它 违 背 了 OCP 原则 ( 开放、 封闭 原则 )， 
每 当 需 要 新 增 一 种 条 件 判断 处 理 时 ， 就 要 新 增 一 个 if-else 分支。 在 很 多 情况 下 ,使 用 函数 表 结 构 
是 避免 过 长 的 多 分 支 结构 的 有 效 方法 ， 下 面 就 是 “ 狼 、 羊 和 菜 过 河 ” 问 题 的 求解 算法 中 用 函数 表 
结构 代 赫 过 长 的 多 分 支 结构 的 例子 。 求 解 “ 狼 、 羊 和 菜 过 河 ” 问 题 ， 从 一 个 状态 过 渡 到 下 一 个 状 
态 是 由 农夫 的 动作 驱动 的 , 农夫 一 共 可 以 采取 8 种 动作 , 每 种 动作 都 对 应 一 个 状态 转变 处 理 流 程 。 
如 果 采 用 if-else 多 分 支 结构 ， 人 处理 状态 转换 的 代码 将 会 非常 长 ， 为 了 避免 过 长 的 分 支 跳 转 代码 ， 
算法 采用 了 函数 表 结 构 。 首 先 声明 函数 表 项 的 定义 : 


typedef bool (*ProcessNextFuncptr)(const ItemState& current, ItemState& next); 
struct Actionprocess 


{ 
Action act; 
ProcessNextFuncptr processFunc,; 


}; 
然后 分 别 为 农夫 的 8 个 动作 指定 处 理 函 数 ， 得 到 冰 数 表 的 定义 : 


Actionprocess actMap[] = 

下 
{ FARMER GO, ProcessFarmerGo }, 
{ FARMER GO TAKE WOLF, ProcessFarmerGoTakeWolf 
{ FARMER GO TAKE SHEEP, ProcessFarmerGoTakeSheep }; 
{ FARMER GO TAKE VEGETABLE, ProcessFarmerGoTakeVegetable }, 
{ FARMER BACK, ProcessFarmerBack }, 
{ FARMER BACK TAKE WOLF, ProcessFarmerBackTakeWolf }, 
{ FARMER BACK TAKE SHEEP, ProcessFarmerBackTakeSheep 后 
{ FARMER BACK TAKE VEGETABLE, ProcessFarmerBackTakeVegetable } 

}; 


如 果 用 felse 结构 ， 处 理 状态 转换 可 能 需要 30 多 行 代码 ， 而 利用 这 个 函数 表 ， 处 理 状态 转 
换 的 代码 只 有 几 行 : 

Itemstate next; 

for(int i = 0; i < sizeof(actMap)/sizeof(actMap[0]); i++) 


{ 
if(actMap[i].act == action) 


{ 
actMap[i].processFunc(current, next); 
break; 
} 
} 
如 果 将 这 个 函数 表 存 人 一 个 关联 容器 ( 比如 std: :map ) 中 ， 则 循环 体 的 代码 都 可 以 省 去 。 如 
果 随 着 算法 演化 ， 有 新 的 动作 需要 处 理 , 则 只 需要 在 函数 表 中 添加 新 的 条 目 即 可 ,状态 转换 的 代 
码 不 需要 做 任何 改动 。 


算法 需要 确定 性 ,分 支 和 跳 转 看 似 使 得 算法 具有 不 确定 性 , 但 是 实际 上 , 分 支 的 判断 和 选择 
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都 是 在 所 有 已 确定 处 理 流程 的 框架 中 进行 的 ,也 就 是 说 , 这些 选择 都 是 算法 确定 范围 之 内 的 选择 ， 
对 算法 确定 性 没有 影响 。 虽然 分 支 和 跳 转 是 算法 构造 的 基础 结构 , 但 是 如 果 能 采用 精心 设计 的 一 
致 性 处 理 逻 辑 避 免 分 文 和 跳 转 ,通常 算法 会 具有 更 好 的 结构 。 前 面 提 到 的 函数 表 就 是 一 个 一 致 性 
处 理 的 例子 , 第 1 章 提 到 的 环形 队列 的 例子 中 ,对 尾 指针 移动 的 处 理 也 是 一 个 例子 ， 如果 不 采 用 
对 入 取 模 的 一 致 性 处 理 ， 则 每 次 指针 移动 时 都 要 做 是 否 已 经 到 表 尾 的 判断 处 理 。 


2.2 ”算法 实现 与 数据 结构 


计算 机 体系 中 的 数据 , 是 指 能 被 计算 机 识别 和 处 理 的 各 种 符号 的 总 称 。 人 类 所 能 识别 的 各 种 
数据 ， 比 如 文字 、 语 言 和 图 像 ， 在 计算 机 内 都 是 以 二 进 制 形式 存在 的 , 但 是 这 些 二 进 制 数 据 之 间 
存在 着 各 种 组 织 关 系 。 我 们 通常 说 的 数据 结构 ， 其实 包含 了 两 层 意思 , 一 是 指 相互 之 间 存 在 某 种 
特定 关系 的 数据 的 集合 ， 二 是 指数 据 之 间 的 相互 关系 ,也 就 是 数据 的 逻辑 结构 。 因 此 ， 当 我 们 说 
定义 数据 结构 时 , 除了 定义 数据 之 间 的 相互 关系 ,还 包括 根据 这 些 关 系 组 织 在 一 起 的 数据 。 在 建 
立 数 学 模型 的 阶段 , 我 们 说 的 数据 结构 更 偏重 于 定义 数据 之 间 的 相互 关系 , 设计 具体 的 算法 步骤 
时 ， 考 虑 的 是 如 何 对 构建 在 这 些 数据 关系 之 上 的 实际 数据 进行 加 工 和 处 理 。 

算法 和 数据 结构 关系 紧密 ,数据 结构 是 算法 设计 的 基础 ， 不 合适 的 数据 结构 设计 ， 有 可 能 
致 无 法 设计 算法 的 演算 步骤， 从 而 无 法 实现 算法 。 数 据 之 间 常 见 的 逻辑 结构 包括 线性 结构 、 关 联 
结构 集合、 映射 )、 树 形 结构 和 图 形 结构 ， 也 有 一 些 资 料 将 树 形 结构 看 作 是 图 形 结构 的 一 种 特 
殊 形 式 , 但 是 因为 这 两 种 数据 结构 在 数据 的 组 织 和 定义 方式 上 存在 很 大 的 差异 , 更 多 的 资料 还 是 
将 它们 分 为 两 种 结构 。 接 下 来 我 们 讨论 一 下 算法 设计 常用 的 儿 种 基本 数据 结构 ,对 于 简单 的 问题 ， 
应 用 这 些 基 本 数据 结构 就 可 以 解决 , 但 是 对 于 复杂 的 算法 , 往往 需要 将 这 些 基 本 的 数据 结构 组 合 
起 来 形成 更 复杂 的 逻辑 结构 。 


2.2.1 基本 数据 结构 在 算法 设计 中 的 应 用 


线性 表 是 数据 结构 中 最 简单 的 基本 数据 结构 。 线 性 表 的 使 用 和 维护 都 很 简单 , 这 一 特点 使 其 
成 为 很 多 算法 的 基础 。 数组、 链表 、 栈 和 队列 是 四 种 最 常见 的 线性 表 ， 其 外 部 行为 和 接口 都 各 有 
特色 ， 本 节 就 简单 介绍 一 下 这 四 种 基本 数据 结构 的 特点 及 其 在 算法 设计 中 的 应 用 。 

1. 数组 

数组 (array ) 是 一 种 相对 比较 简单 的 数据 组 织 关 系 , 所 有 数据 元 素 存储 在 一 片 连续 的 区 域内 。 
对 数组 的 访问 方式 一 般 是 通过 下 标 直 接 访 问 数组 元 素 ， 除 此 之 外 ， 对 数组 的 基本 操作 还 有 插入 、 
删除 和 查找 。 数 组 元 素 的 直接 访问 几乎 没有 开销 , 但 是 插入 和 删除 操作 需要 移动 数组 元 素 , 开销 
比较 大 ,因此 在 插入 和 删除 操作 比较 频繁 的 场合 下 ,不 适合 使 用 数组 。 在 数组 中 查找 一 个 元 素 的 
时 间 复 杂 度 是 O(n), 如果 数 组 元 素 是 有 序 存储 的 , 则 使 用 二 分 查找 可 以 将 时 间 复 杂 度 降 为 Odgm)。 

在 数组 中 存储 的 数组 元 素 , 除了 数组 元 素 的 值 需 要 关注 之 外 , 数组 元 素 的 下 标 也 是 一 个 很 有 
用 的 属性 , 有 时候 可 以 巧妙 地 利用 下 标 简 化 一 些 算法 的 实现 方式 , 例如 , 有 若干 个 数 存放 在 value 
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数组 中 ， 这 些 数 的 取 值 范围 是 [1-100]， 请 设计 一 个 算法 统计 一 下 这 些 数 中 相同 的 数 出 现 的 次 数 。 
经 分 析 发 现 ， 虽 然 value 中 数字 的 个 数 很 多 ， 但 是 范围 并 不 大 ， 可 以 设计 一 个 有 100 个 元 素 的 数 
组 , 数组 元 素 的 下 标 对 应 数字 ,数组 元 素 的 值 就 是 对 应 数字 出 现 的 次 数 ， 只 需 如 下 两 行 代码 即 可 
完成 统计 工作 : 
for(int i = 0; i < count; i++) 
numCount[values[i] - 1]++; 


昌 然 对 于 那些 没有 出 现 过 的 数字 也 需要 占用 numcount[] 数 组 的 一 个 位 置 , 但 是 这 点 空间 上 的 
开销 是 可 以 接受 的 。 

相对 于 固定 长 度 的 数组 ， 还 有 可 变 长 度 的 数组 ， 比 如 C++ 的 STL 提供 的 std: :vector， 可 变 
长 数组 具有 数组 的 访问 效率 ,同时 长 度 可 随 着 数据 元 素 的 增加 而 变 长 ,使 用 场合 比 定 长 数组 灵活 。 
除了 用 一 维 数组 表示 线性 表 之 外 , 还 可 以 用 多 维 数组 表示 更 复杂 的 局 面 ， 比 如 棋盘 类 游戏 可 以 使 
用 二 维 数 组 表示 棋盘 状态 ， 魔 方 类 的 游戏 还 可 能 用 到 三 维 数组 ， 需 要 根据 问题 的 情况 灵活 运用 。 

2. 链表 

在 线性 表 的 长 度 不 能 确定 的 场合 ， 一 般 会 采用 链表 (linked list ) 的 形式 。 链 表 结 构 的 每 个 节 
点 数据 都 由 两 个 域 组 成 , 一 个 是 存放 实际 数据 元 素 的 数据 域 , 另 一 个 就 是 构成 链 式 结构 的 指针 域 。 
对 于 单 向 链表 ， 指 针 域 上 只 有 一 个 后 向 指针 ， 对 于 双向 链表 ， 指 针 域 由 一 个 后 向 指针 和 一 个 前 向 指 
针 组 成 。 链表 的 插入 和 删除 只 需要 修改 指针 域 的 指针 指向 即 可 完成 ， 比 数组 的 插入 和 删除 操作 效 
率 高 ,但 是 访问 数据 元 素 的 效率 比较 低 , 需要 从 链表 头 部 向 后 (或 向 前 ) 搜索 ， 查 找 操作 的 时 间 
复杂 度 是 O(n)。 理论 上 链表 的 长 度 是 不 受 限制 的 , 实际 使 用 链表 时 ,和 常 受 存储 器 空间 的 限制 , 使 
得 链表 长 度 也 不 能 无 限 增长 ,但 是 链表 长 度 可 动态 变化 这 一 点 ， 比 数组 具有 很 大 的 优势 。 

单 呵 链表 只 能 在 一 个 方向 上 遍历 链表 节点 ， 从 一 个 节点 开始 遍历 到 链表 的 尾部 节点 就 停止 。 
双 癌 链表 可 以 从 两 个 方向 遍历 链表 节点 ， 从 一 个 节点 开始 ， 问 前 遍历 到 链表 头 部 节点 停止 ,向 后 
遍历 到 链表 尾部 节点 停止 。 在 某 些 应 用 场合 , 还 可 以 将 链表 尾部 节点 的 后 向 指针 指向 链表 头 部 节 
点 《对 于 双向 链表 ， 其 头 部 节点 的 前 向 指针 同时 指向 链表 的 尾部 节点 )， 构 成 一 个 环形 链表 。 环 
形 链表 中 头 部 节点 和 尾部 节点 的 概念 已 经 弱化 ， 从 任何 一 个 节点 开始 都 可 以 遍历 整个 链表 。 


链表 的 头 点 作为 整个 链表 遍历 的 起 点 ， 是 一 个 比较 特殊 的 节点 ， 需 要 特殊 处 理 , 尤其 是 在 
插入 和 删除 节点 的 时 候 。 如 果 节 点 插入 在 头 节 点 之 前 ， 或 者 删除 的 节点 就 是 头 节点 ， 就 需要 调整 
链表 头 节 点 的 指针 ， 和 否则 的 话 ， 仍 用 原来 保存 的 头 节点 访问 链表 ， 就 可 能 跳 过 新 插入 的 节点 ,或 
操作 已 经 失效 的 指针 。 为 了 解决 这 个 问题 , 人们 设计 了 一 种 在 链表 中 使 用 国定 头 节 点 的 方法 ,这 
个 固定 的 头 节点 称 为 “ 表 头 节点 ”， 也 被 称 为 “ 哑 节 点 ”( dummy node ),《 算 法 导论 》 一 书 将 其 
称 为 “哨兵 节点 "。 表 头 节 点 可 以 是 一 个 没有 数据 域 、 只 有 指针 域 的 特殊 节点 ， 也 可 以 是 和 其 他 
节点 类 型 一 样 的 节点 ( 数据 域 不 使 用 )， 更 多 的 情况 是 在 表 头 节点 的 数据 域 中 放置 一 些 与 链表 有 
关 的 状态 信息 ,比如 当前 链表 中 的 数据 元 素 节 点 个 数 。 表 头 节点 的 指针 域 始终 指向 第 一 个 实际 链 
表 节 点 ， 如 果 表 头 节点 的 指针 域 是 WLL， 则 表示 这 个 链表 是 空 表 。 使 用 表 头 节点 的 好 处 有 两 个 ， 
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一 个 好 处 是 无 论 链表 是 否 为 空 表 ,始终 有 一 个 能 标识 链表 的 头 节 点 , 可 以 用 一 致 的 方法 处 理 空 链 
表 和 非 空 链表 ; 另 一 个 好 处 是 对 链表 进行 插入、 删除 和 遍历 操作 时 ,不 需要 对 数据 元 素 的 首 节 点 
和 中 间 节 点 做 差异 处 理 ， 对 每 个 节点 的 操作 可 以 做 到 一 致 性 。 

除了 查找 和 访问 的 效率 没有 数组 高 之 外 , 链表 的 每 个 节点 都 要 额外 存储 一 个 指针 域 , 因此 需 
要 一 定 的 存储 开销 。 对 于 一 些 搬入 和 删除 操作 比较 少 , 查找、 遍历 操作 比较 多 的 场合 ， 应 该 优先 
选择 使 用 可 变 长 数组 代替 链表 。 


3. 栈 


栈 (stack ) 是 一 种 特殊 的 线性 表 ， 其 特殊 性 在 于 只 能 在 表 的 一 端 插 入 和 删除 数组 元 素 , 插入 
和 删除 动作 分 别 被 称 为 “入 栈 ” 和 “出 栈 ”。 严 格 来 说 ， 栈 不 是 一 种 数据 存储 方式 ， 而 是 一 种 逻 
辑 管理 方式 ， 它 遵循 “后 进 先 出 ”(Last In First Out ) 的 原则 管理 和 维护 表 中 的 数据 。 栈 的 数据 存 
储 方式 可 以 采用 数组 ， 也 可 以 使 用 链表 ， 分 别 被 称 为 “顺序 栈 ” 和 “ 链 式 栈 ”"， 但 是 无 论 采 用 何 
种 存储 方式 ， 其 外 部 行为 都 是 一 样 的 ， 即 只 能 通过 “出 栈 ” 和 “和信 栈 ”的 方式 在 数据 表 的 一 端 操 
作 数 据 。 

栈 是 一 种 非常 有 用 的 数据 结构 , 利用 栈 的 一 些 特性 , 可 以 将 某 算法 的 递归 实现 转换 成 非 递归 
实现 , 在 使 用 穷尽 搜索 方法 时 ,也 会 使 用 栈 保 存 当 前 的 状态 ， 有 了 时候， 广度 优先 搜索 和 深度 优先 
搜索 的 差异 仅仅 是 使 用 栈 还 是 使 用 队列 。 下 面 是 一 个 判断 表达 式 的 括号 是 否 匹配 的 小 算法 , 可 以 
体会 一 下 这 种 “先进 后 出 ”的 数据 结构 的 特点 。 


bool IsMatchBrackets(const std::string& express) 


std::stack<std: :string: :value type> epStk; 
std::string::size type i; 
for(i = 0; i < express.length(); i++) 


if(IsLeftBrackets(express[i])) 
epstk.push(express[i]); 
if(IsRightBrackets(express[i])) 
if(epStk.empty()) 
return false; 
epstk.pop(); 
上 


return epStk.empty(); 
} 


4. 队列 
队列 ( queue ) 也 是 一 种 特殊 的 线性 表 ， 普 通 的 队列 只 能 在 表 的 一 端 插入 数据 ， 在 另 一 端 删 
除数 据 , 不 能 在 队列 的 其 他 位 置 插入 和 删除 数据 。 插入 和 删除 动作 分 别 被 称 为 “入 队 ” 和 “出 队 ”， 
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能 执行 “入 队 ” 的 一 端 称 为 “后 端 ”( rear )， 能 执行 出 队 的 一 端 称 为 “前 端 ”( front )。 与 栈 一 样 ， 
队列 也 不 是 一 种 数据 存储 方式 ， 而 是 一 种 逻辑 管理 方式 ， 它 遵循 “先进 先 出 (First In First Out 》” 
的 原则 管理 和 维护 表 中 的 数据 。 队 列 的 数据 存储 方式 可 以 采用 数组 ， 也 可 以 使 用 链表 。 

队列 有 多 种 使 用 形式 ， 比 如 第 1 章 介绍 过 的 环形 队列 〈 循环 队列 )， 还 有 可 以 在 队列 的 两 端 
都 执行 “入 队 ” 和 “出 队 ” 操 作 的 双 端 队列 (double-ended queue )， 还 有 给 每 个 数据 元 素 打 上 优 
先 级 标签 的 优先 级 队列 ( priority queue )， 等 等 。 队 列 在 算法 中 的 应 用 非常 广泛 ， 比 如 图 的 广度 优 
先 搜索 算法 , 就 使 用 一 个 队列 存放 与 当前 搜索 节点 有 边 相 连 的 所 有 邻接 点 ,以 先进 先 出 的 原则 一 
个 一 个 地 处 理 队 列 中 的 节点 。 操作 系 统 中 的 线程 调度 算法 , 常 使 用 带 优先 级 的 队列 管理 就 绪 线 程 
列表 ， 高 优先 级 的 线程 插入 在 队列 的 前 端 ， 获 得 优先 调度 ( 出 队 ) 的 机 会 。 队 列 也 是 不 同 速率 的 
IO 设备 之 间 缓 冲 区 管理 的 常用 方式 ， 比 如 打印 机 打印 速度 比较 慢 ， 操 作 系 统 会 为 每 个 打印 机 维 
护 一 个 打印 队列 ,对 不 同 进程 提交 的 打印 操作 做 入 队 管 理 , 可 以 避免 因 一 个 大 文件 打印 时 间 过 长 
造成 其 他 进程 无 法 提交 打印 操作 的 问题 。 网 络 设备 中 也 普遍 使 用 队列 来 管理 数据 报 文 的 发 送 和 接 
收 ， 以 匹配 不 同 速率 的 设备 之 间 的 数据 传输 。 


2.2.2 ”复杂 数据 结构 在 算法 设计 中 的 应 用 


上 一 节 讨 论 的 基本 数据 结构 都 属于 线性 表 范 围 , 表 中 的 数据 元 素 之 间 没 有 关系 ,只 是 通过 不 
同 的 组 织 和 管理 方式 将 每 个 数据 元 素 维护 在 一 个 线性 表 中 。 本 节 将 介绍 的 这 些 数据 结构 不 是 简单 
的 线性 表 , 并 且 每 个 数据 元 素 之 间 也 可 能 存在 关系 ， 比 如 树 的 节点 之 间 存 在 父子 关系 ,图 的 节点 
之 间 存 在 邻接 关系 ， 等 等 。 之 所 以 被 称 为 “复杂 数据 结构 "， 是 因为 相关 的 搬入 、 删 除 操作 不 仅 
对 数据 元 素 进行 操作 ， 还 要 同时 维护 数据 元 素 之 间 的 关系 。 


1. 树 
树 (tree ) 是 一 种 表达 数据 之 间 层 次 关系 的 数据 结构 , 树 中 的 每 个 节点 有 0 个 或 多 个 子 节点 ， 
但 是 只 有 一 个 父 节 点 ， 父 节点 为 空 的 节点 就 是 根 节点 , 一 棵 树 只 有 一 个 根 节点 。 树 结构 的 相关 概 
念 如 下 。 
口 树 的 度 : 一 个 节点 含有 子 树 的 个 数 称 为 该 节点 的 度 ， 一 棵 树 中 最 大 市 点 的 度 称 为 整 棵 树 
的 度 。 
口 叶 节 点 : 度 为 0 的 节点 称 为 叶 节 点 。 
口 根 节点 : 没有 父 节点 的 节点 就 是 根 节点 。 
口 树 的 高 度 : 从 根 节点 开始 ， 每 多 一 级 子 节点 ， 树 的 层次 就 +1， 一 棵 树 的 最 大 层次 数 就 是 
树 的 高 度 。 
口 兄弟 节点 ; 具有 相同 父 节 点 的 子 节点 互 称 为 兄弟 节点 。 


树 适合 用 来 表达 有 层次 关系 的 数据 , 比如 一 个 公司 的 分 支 机 构 、 计 算 机 上 的 目录 和 文件 结构 ， 
等 等 。 如 果树 的 子 节点 之 间 没 有 大 小 关系 ， 则 这 样 的 树 就 称 为 无 序 树 , 也 称 自 由 树 ; 如 果树 的 子 
节点 之 间 有 大 小 关系 ， 则 这 样 的 树 就 称 为 有 序 树 。 树 通常 也 被 认为 是 图 的 一 种 形式 ,是 一 种 没有 
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环 路 的 图 ， 比 如 自由 树 可 被 视 为 一 个 连通 的 、 无 环 路 的 无 向 图 。 根 据 每 个 节点 的 子 节 点 的 数量 ， 
又 可 以 将 树 分 为 二 叉 树 和 多 又 树 ，B 树 就 是 一 种 典型 的 多 又 树 。 

有 序 的 二 叉 树 也 被 称 为 二 叉 查 找 树 (binary search tree ) 或 二 又 排序 树 (binary sort tree )。 相 

对 于 普通 的 二 又 树 ， 二 又 查 找 树 有 以 下 两 个 特点 : 

口 如 果 左 子 树 不 为 空 ， 则 左 子 树 上 所 有 节点 的 值 都 小 于 根 节点 的 值 ; 

口 如 果 右 子 树 不 为 空 ， 则 右 子 树 上 所 有 节点 的 值 都 大 于 根 节点 的 值 。 

二 叉 查 找 树 的 特点 是 所 有 新 插入 的 节点 都 是 叶子 节点 , 已 经 存在 的 节点 的 位 置 比较 固定 。 
又 查 找 树 查找 操作 的 时 间 复 杂 度 是 O(lgn), 虽然 线性 有 序 表 的 查 
找 操作 时 间 复 杂 度 也 是 O(lgn)( 折 半 查找 ), 但 是 线性 有 序 表 不 
能 表达 数据 元 素 之 间 的 关系 ,简单 二 又 查找 树 的 插入 操作 都 发 生 
在 叶 节点 ， 如 果 构 造 二 又 查找 树 时 依次 插入 的 节点 已 经 是 有 序 
的 ， 则 三 又 树 会 退化 为 链表 形状 的 单 支 树 ， 如 图 2-2 所 示 ， 在 这 
种 情况 下 ,查找 效率 就 会 下 降 , 查 找 操作 的 时 间 复 杂 度 变 成 O(n)。 
为 了 优化 查找 效率 , 就 需要 二 又 查找 树 能 够 具有 自 平 衡 功 能 , 保 
证 二 叉 树 始终 是 一 棵 平衡 树 。AVL 树 和 红 黑 树 就 是 这 样 的 自 平 
衡 二 叉 查 找 树 ， 二 者 的 区 别 在 于 维持 树 的 自 平衡 的 方法 不 一 样 。 
在 算法 设计 时 ， 只 要 有 条 件 就 应 该 优先 使 用 AVL 树 和 红 黑 树 ， 图 2-2 退化 为 链表 的 二 又 排序 树 
避免 简单 二 又 查找 树 可 能 存在 的 性 能 问题 。 

二 又 查找 树 在 算法 中 的 应 用 也 很 广泛 ， 比 如 决策 问题 可 以 使 用 二 叉 查 找 树 构造 决策 树 , 一 些 
统计 问题 也 可 以 使 用 二 又 查 找 树 的 形式 组 织 各 种 信息 数据 节点 , 其 他 的 问题 如 果 能 将 最 终 的 结果 
转化 成 取舍 问题 ， 也 可 以 使 用 二 叉 查 找 树 。 

多 叉 树 的 典型 例子 就 是 B 树 和 各 种 B 树 的 变形 树 ，B 树 是 一 种 自 平衡 多 又 查找 树 ， 对 于 一 
棵 M 阶 B 树 来 说 ， 其 每 个 非 终端 节点 至 少 有 | M /2 | 个 子 树 ， 但 是 最 多 有 M 个 子 树 ， 根 节点 如 
果 不 是 终端 节点 ， 则 至 少 有 2 个 子 树 。 每 个 节点 有 N 个 关键 字 ， 所 有 的 终端 节点 都 在 统一 的 层 
次 上 , 但 是 不 带 任何 关键 字 信息 。B+ 树 是 B 树 的 一 种 变形 , 它 与 B 树 的 差别 在 于 对 终端 节点 的 
处 理 ，B+ 树 的 所 有 终端 节点 包含 了 全 部 关键 字 的 信息 ， 同 时 还 有 指向 这 些 关键 字 所 在 节点 的 指 
针 ， 并且 终端 节点 按照 关键 字 的 大 小 排序 ， 形 成 一 个 有 序 链接 ， 因 此 对 B+ 树 进行 查找 ， 可 以 从 
最 小 关键 字 开 始 顺 序 查找 (遍历 所 有 的 终端 节点 )， 也 可 以 从 根 节 点 开始 遍历 。B 树 常用 于 文件 
管理 系统 和 数据 库 系统 ， 在 算法 设计 时 ， 如 果 遇 到 多 路 分 支 上 且 有 序 的 层次 结构 时 ， 就 可 以 考虑 
使 用 B 树 。 

区 间 树 是 一 种 以 区 间 为 数据 元 素 的 红 黑 树 , 区间 树 的 每 个 节点 都 表示 一 个 区 间 , 其 关键 字 是 
区 间 的 左 端点 , 区 间 树 支持 所 有 的 二 又 查找 树 的 基本 操作 , 而 且 区 间 元 素 的 插入 和 查找 操作 都 可 
以 在 O(gn) 的 时 间 内 完成 。 区 间 树 的 查找 不 是 精确 查找 , 但 是 可 以 确定 区 间 树 上 是 否 存 在 能 完整 
覆盖 给 定 的 被 查找 区 间 的 节点 (区间 )。 区 间 树 还 支持 获取 某 个 子 树 的 最 大 右 端点 的 值 的 操作 ， 
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这 个 操作 的 意义 在 于 当 查 找 一 个 区 间 时 , 如 果 左 子 树 的 最 大 右 端 点 的 值 小 于 当前 查找 区 间 的 左 端 
点 的 值 ， 就 说 明 左 子 树 与 当前 查找 的 区 间 不 存在 重合 , 需要 转 到 右 子 树 继 续 查 找 。 区 间 树 常用 于 
区 间 查 询 相 关 的 问题 ， 比 如 判断 区 间 之 间 是 否 存 在 重 公 区 域 等 问题 。 

线段 树 也 是 一 种 以 区 间 为 数据 元 素 的 二 又 查找 树 , 和 区 间 树 不 同 的 是 , 线段 树 上 的 每 个 非 叶子 ce 
节点 表示 的 区 间 范 围 是 其 子 节 点 的 区 间 范 围 之 和 。 如 果 线 段 树 中 一 个 非 叶子 节点 表示 的 区 间 是 
[4,5]， 则 它 的 左 子 树 表示 的 区 间 就 是 [a,(a+5)/2]， 右 子 树 表 示 的 区 间 就 是 [(a+5)/2,b]， 由 此 可 知 ， 线 
段 树 是 一 棵 平衡 二 叉 树 ， 一 棵 表示 长 度 范围 为 [1. 刀 的 线段 树 的 高 度 是 lg(DJ) + 1。 叶子 节点 表示 不 可 
分 的 最 小 区 间 范 围 ， 如 果 将 一 个 大 区 间 分 成 n 个 小 区 间 ， 则 对 应 的 线段 树 将 有 nn 个 叶子 节点 , n 
个 叶子 节点 的 小 区 间 共 同 组 成 整个 大 区 间 。 和 区 间 树 一 样 ， 线 段 树 也 可 以 用 来 做 区 间 重 县 性 判断 ， 
除 此 之 外 , 线段 树 在 统计 学 相关 的 问题 中 应 用 也 很 广泛 。 比 如 一 些 统计 信息 , 既 需 要 查询 在 一 个 大 
的 区 间 上 的 统计 值 , 也 需要 查询 在 这 个 大 范围 中 的 某 个 小 范围 内 的 统计 值 , 就 可 以 应 用 线段 树 。 举 
个 例子 , 假如 某 杂 志 需 要 统计 各 个 年 龄 段 读 者 的 比例 , 可 以 将 统计 的 读者 数量 信息 按照 年 龄 区 间 组 
织 成 一 棵 线段 树 , 如 果 一 个 节点 的 左边 子 节点 是 年 龄 在 20~30 岁 之 间 的 读者 数量 , 右边 子 节 点 是 年 
龄 在 30~40 岁 之 间 的 读者 数量 ， 则 这 个 节点 表示 的 就 是 年 龄 在 20~40 岁 之 间 的 读者 数量 。 

堆 也 是 一 种 完全 树 , 除了 树 的 特征 之 外 , 堆 的 父 节点 和 子 节 点 还 存在 一 些 特殊 关系 。 最 大 堆 
的 每 个 节点 的 值 都 大 于 其 子 树 上 所 有 节点 的 值 , 最 小 堆 的 每 个 节点 的 值 都 小 于 其 子 树 上 所 有 节点 
的 值 。 堆 的 插入 和 删除 操作 除了 维持 堆 的 完全 树 特征 之 外 ， 还 要 维持 节点 之 间 的 这 个 特殊 关系 ， 
通常 可 以 利用 这 一 点 实现 一 些 特殊 的 功能 ， 比 如 堆 排 序 , 就 是 利用 堆 的 这 个 特殊 性 质 ， 再 比如 经 
典 的 “ 求 n 个 数 中 最 大 (或 最 小 ) 的 m 个 数 的 问题 "， 就 是 通过 维 O 
护 一 个 有 m 个 节点 的 最 大 堆 (或 最 小 堆 ) 来 实现 的 。 

解决 一 些 与 字符 串 相关 的 问题 时 ， 还 会 用 到 字典 树 ， 比 如 典型 
的 前 级 树 和 后 缀 树 ， 图 2-3 就 是 一 个 字典 树 的 例子 。 字 典 树 以 树 的 人 司 
形式 保存 大 量 字符 串 〈 前 级 或 后 级 )， 常 被 各 种 文本 搜索 算法 用 于 
文字 和 词 频 的 统计 。 字典 树 的 优点 是 利用 字符 串 的 公共 前 级 或 后 级 人 四 
节约 存储 空间 ， 查 找 过 程 中 能 减少 无 谓 的 完整 字符 串 匹 配 , 便于 字 
符 串 的 统计 和 查找 。 人 

2. 集合 图 2-3 字典 树 示 意图 

简单 来 说 ,集合 ( set ) 是 具有 某 种 特性 的 事物 的 整体 ,构成 集合 的 事物 或 对 象 称 作 集 合 的 元 
素 或 成 员 。 集 合 内 的 数据 元 素 具 有 以 下 特征 。 
口 无 序 性 : 一 个 集合 中 每 个 元 素 的 地 位 都 是 相同 的 ， 元 素 之 间 不 存在 有 序 关 系 ， 也 没有 类 
似 树 和 图 那样 的 复杂 关系 。 
口 互 异性 : 一 个 集合 中 每 个 元 素 只 能 出 现 一 次 ， 也 就 是 说 ,集合 内 没有 重复 的 元 素 。 
口 确定 性 : 集合 的 定义 是 确定 的 ， 根据 这 个 定义 可 以 明确 判定 一 个 对 象 是 否 属于 这 个 集合 ， 

不 存在 模棱两可 的 情况 。 
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集合 的 主要 操作 包括 两 部 分 ,一 部 分 是 对 集合 元 素 的 操作 , 包括 插入 和 删除 集合 元 素 、 判 断 
一 个 元 素 是 否 属于 集合 等 ; 另 一 部 分 是 集合 之 间 的 关系 运算 , 包括 集合 的 求 交 集 、 并 集运 算 以 及 
求 差 运算 等 。 集 合作 为 一 种 数据 元 素 的 组 织 方式 ， 在 算法 设计 中 应 用 也 很 广泛 ， 比 如 第 19 章 介 
绍 数 独 游戏 的 算法 时 ， 就 使 用 集合 来 管理 每 个 小 单元 格 的 候选 数列 表 。 

3. 哈 希 表 与 映射 

哈 希 表 (hash ) 与 映射 (map ) 都 是 通过 关键 字 ( key ) 直接 访问 数据 元 素 的 值 (value ) 的 数 
据 结构 ， 二 者 的 外 部 接口 是 一 样 的 ， 但 是 不 同 的 平台 上 对 内 部 实现 稍 有 差异 。 比 如 C++ 的 STL 
库 中 ，std: :hash_map 采用 一 个 哈 希 函数 实现 从 关键 字 到 值 的 映射 关系 ,数据 的 插入 、 删 除 和 查找 
的 时 间 复 杂 度 都 是 O(1)， 而 std: :map 则 是 采用 红 黑 树 实 现 关 键 字 和 值 的 存储 ， 数 据 的 插入 、 删 
除 和 查找 的 时 间 复 杂 度 都 是 O(lg(n))。 


哈 希 表 的 原理 是 通过 一 个 哈 希 函数 对 关键 字 进 行 某 种 运算 , 得 到 对 应 的 数据 元 素 在 表 中 的 存 
储 位 置 ， 然 后 访问 其 值 ， 与 普通 的 有 序 表 查找 相 比 ， 和 额外 的 哈 希 处 理会 造成 数据 访问 的 开销 , 但 
是 哈 希 表 的 查找 时 间 是 固定 的 , 不 随 哈 希 表 中 数据 元 素 的 增多 而 变化 。 普 通 有 序 表 的 查找 时 间 复 
林 度 是 O(lg(n))， 随 着 n 的 增 大 ， 查 找 时 间 也 变 长 ， 当 数据 元 素 非 常 多 的 时 候 ， 哈 希 表 的 查找 速 
度 会 比 普 通 有 序 表 快 ， 这 就 是 哈 希 表 的 优势 。 

现实 生活 中 有 很 多 采用 “key-value” 方 式 组 织 和 存储 数据 的 情况 ， 学生 成绩 管 理 系统 会 通过 
一 个 唯一 分 配 的 学 号 建立 与 具体 学 生 信息 的 映射 关系 , 可 以 通过 学 号 查询 和 管理 学 生 信 息 , 这 个 
学 号 就 是 key。 

4. 


图 (graph ) 是 一 种 特殊 的 数据 组 织 方 式 ， 它 不 仅 可 以 存储 数据 元 素 ( 对象 )， 还 可 以 存储 数 

据 元 素 之 间 的 复杂 关系 。 从 直观 上 看 ,图 由 一 些 顶 点 和 连接 这 些 顶 点 的 边 组 成 , 顶点 描述 数据 元 

素 ， 边 描述 数据 元 素 之 间 的 关系 。 图 有 很 多 种 分 类 方式 ,根据 边 是 否 有 方向 ， 可 将 图 分 为 有 向 图 

和 无 向 图 ; 根据 任意 两 个 顶点 之 间 边 的 个 数 ， 可 将 图 分 为 简单 图 和 多 重 图 ; 根据 任意 两 个 顶点 之 

间 的 连通 性 ， 可 将 图 分 为 连通 图 和 非 连 通 图 。 根 据 边 的 地 位 平等 性 ， 可 分 为 带 权 图 和 不 带 权 图 。 

无 论 采 用 何 种 方法 对 图 分 类 , 定义 图 的 方式 基本 上 只 有 两 种 : 二 元 组 定义 和 三 元 组 定义 。 对 于 图 

G， 如 果 KG) 表 示 顶 点 集 ，E(G) 表 示 边 集 ， 则 (VB) 即 为 图 的 二 元 组 定义 。 如 果 存 在 关联 函数 7 

将 E(G) 中 的 每 一 条 边 映射 到 KV(G) 中 的 两 个 顶点 ， 即 Te)=(w,v), 其 中 wv 属于 VG), 且 是 e 的 两 

个 顶点 ， 则 将 (5, DD) 称 为 图 的 三 元 组 定义 。 

图 的 存储 常 采用 邻接 矩阵 ( 二 维 数组 方式 ) 和 邻接 表 ( 链表 或 可 变 长 数组 ) 方式 ， 对 于 有 向 
， 有 了 时候 也 采用 十 字 链 表 方 式 。 图 的 遍历 是 一 个 非常 重要 的 操作 ,一般 可 采用 深度 优先 搜索 和 
A 深度 优先 搜索 策略 可 以 理解 为 树 的 中 序 ( 先 根 ) 遍历 的 推广 ,深度 优先 

1 出 发 ， 先 访问 vy， 然后 选择 一 个 与 vy 相 邻 旦 没 被 访问 过 的 顶 

点 vi 访问 , 再 从 vi 出 发 选择 一 个 与 v 相 邻 且 未 被 访问 的 顶点 进行 访问 , 依次 遍历 。 如 果 当 前 被 

访问 过 的 顶点 的 所 有 邻接 顶点 都 已 被 访问 , 则 退回 到 已 被 访问 的 顶点 序列 中 最 后 一 个 拥有 未 被 访 
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问 的 相 邻 顶点 的 顶点 ve， 从 vi 出 发 按 同 样 的 方法 向 前 遍历 ,直到 图 中 的 所 有 顶点 都 被 访问 过 。 从 
某 个 顶点 开始 深度 优先 搜索 的 伪 代 码 实 现 如 下 : 


// 从 第 Vv 个 顶点 出 发 递归 地 深度 优先 遍历 图 6 
void DFS(Graph G, int v) 


VisitFunction(v); // 访 问 v 点 ， 并 将 其 标记 为 访问 过 的 节点 ; 
for each(vi: v 的 所 有 邻接 点 )// 遍 历 v 的 所 有 邻接 点 
{ 
if(vi 没有 被 访问 过 ) 
DFS(G, vi); 
} 
} 


广度 优先 搜索 的 过 程 是 : 首先 访问 初始 点 v, 接着 依次 访问 vy 的 所 有 未 被 访问 过 的 邻接 点 v1， 
风 ，…，yi， 然 后 再 按照 yj，v,，… ,vi 的 次 序 ， 依 次 访问 这 些 节 点 的 邻接 点 ( 未 被 访问 过 的 邻接 
点 ), 依 次 遍历 ， 直 到 图 中 所 有 和 初始 点 vi 相 邻 的 顶点 都 被 访问 过 为 止 。 为 了 保证 v 的 所 有 邻接 
点 被 按照 顺序 依次 处 理 , 就 需要 使 用 队列 来 管理 这 些 邻 接点 ,这些 都 体现 在 广度 优先 搜索 算法 的 


void BFS(Graph G, int v) 
for each(vi: v 的 所 有 邻接 点 )// 遍 历 v 的 所 有 邻接 点 
if(vi 没有 被 访问 过 ) 
VisitFunction(Vi); // 访 问 V 点 ; 
EnQueue(Q，vi); //vi 入 队列 


} 
while(!OueueEmpty(O) ) 


DeQueue(Q0，u); // 队 头 元 素 出 队 并 置 为 U 
BFS(G, u); 
} 
} 


现实 生活 中 很 多 地 方 都 用 到 了 使 用 图 的 算法 ,比如 你 在 地 图 软件 中 选择 两 个 点 , 软件 会 给 出 
连接 这 两 个 点 之 间 的 最 佳 路 线 , 这 就 要 用 到 图 的 连通 性 判断 和 最 短路 径 搜索 算法 。 当 有 多 条 路 径 
可 以 连接 两 个 点 的 时 候 , 软件 还 可 以 根据 不 同道 路 的 实时 交通 拥堵 情况 ,选择 最 快捷 的 道路 , 其 
实 也 就 是 为 每 条 道路 设置 不 同 的 权重 , 然后 进行 带 权 图 的 最 优 路 径 搜 索 。 交 通 规划 常常 需要 用 最 
小 的 成 本 ( 修 最 少 的 路 ) 将 不 同 的 城市 连接 起 来 , 保证 每 个 城市 之 间 都 可 以 到 达 , 就 需要 最 小 生 
成 树 算法 。 网 络 设备 之 间 为 了 避免 出 现 环 路 ， 也 需要 运行 一 个 最 小 生成 树 协 议 〈STP )， 也 是 图 
的 应 用 。 项 目 管理 中 计算 项 目 活动 的 安排 和 求解 项 目 关 键 路 径 功能 , 也 会 用 到 有 向 图 的 拓扑 排序 
和 关键 路 径 算法 , 本 书 第 9 章 就 介绍 了 一 个 拓扑 排序 和 关键 路 径 算法 在 项 目 管理 软件 中 得 到 应 用 
的 例子 。 
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2.3 ”数据 结构 和 数学 模型 与 算法 的 关系 


西方 有 句 谚语 : 手 里 拿 三 年 锤子 ， 看 什么 都 是 钉子 。 如 果 一 个 人 的 本 事 就 只 会 抢 大 锤 ， 那 他 
解决 问题 的 方法 就 是 拿 锤子 磺 。 有 时 候 ， 工具 可 以 决定 思维 。 为 什么 要 强调 数据 结构 的 重要 性 ? 
因为 数据 结构 是 建立 解决 问题 的 数学 模型 的 基础 ， 如 果 不 了 解数 据 结 构 ， 就 没有 办 法 建立 模型 ， 
或 者 建立 的 模型 不 合适 ， 导 致 算法 演化 困难 ， 甚 至 无 法 实现 ,第 1 章 环形 队列 的 使 用 就 是 最 好 的 
例子 。 掌 握 的 数据 结构 越 多 ， 就 相当 于 手中 的 工具 越 多 ， 解 决 问题 的 思路 就 越 宽 。 虽 然 我 也 建议 
大 家 尽量 多 地 掌握 复杂 数据 结构 的 实现 原理 , 但 是 大 多 数 情况 下 ,这 并 不 是 必需 的 内 容 ， 只 要 知 
道 数 据 结构 的 特性 和 对 外 的 接口 ,就 可 以 在 算法 设计 时 套用 这 些 模式 解决 问题 。 了 解 这 些 数据 结 
构 的 构造 和 操作 原理 固然 重要 ， 但 是 对 于 算法 设计 来 说 ， 灵 活 运用 这 些 数据 结构 也 很 重要 。 

另 一 方面 , 我 们 也 强调 数学 模型 , 但 是 这 并 是 不 单纯 地 说 所 有 问题 都 是 数学 问题 , 而 是 因为 计 
算 机 善于 处 理 数学 问题 。 或 者 我 们 可 以 将 其 描述 为 更 笼统 的 概念 比如 计算 机 模型 。 但 是 实质 都 是 
一 样 的 ,如果 要 计算 机 解决 问题 ,就 必须 用 计算 机 能 理解 的 方式 描述 问题 。 建立 问 题 的 数学 模型 实 
际 上 是 对 问题 的 一 种 抽象 的 表达 ,通常 也 需要 伴随 着 一 些 合理 的 假设 ,其 目的 就 是 对 问题 进行 简化 ， 
抓 住 主要 因素 , 舍弃 次 要 因素 ,逐步 用 更 精确 的 语言 描述 问题 , 最 终 过 渡 到 用 计算 机 语言 能 够 描述 
问题 为 止 。 让 我 们 来 看 两 个 通过 建立 抽象 的 模型 ， 将 看 似 复杂 的 问题 简化 并 最 终 解决 的 例子 吧 。 

一 个 工程 项 目 经 过 层 层 结构 分 解 最 终 得 到 一 系列 具体 的 活动 , 这 些 活动 之 间 往 往 存在 复杂 的 
依赖 关系 ， 如 何 安排 这 些 活动 的 开始 顺序 ,使 得 项 目 能 够 顺利 完成 是 个 艰巨 的 任务 。 但 是 如 果 能 
把 这 个 问题 转化 成 有 向 图 ， 图 的 顶点 就 是 活动 ， 顶 点 之 间 的 有 向 边 代表 活动 之 间 的 前 后 关系 ， 则 
只 需要 使 用 简单 的 有 向 图 拓扑 排序 算法 就 可 以 解决 这 个 问题 。 一 个 工程 分 解 出 这 么 多 的 活动 , 每 
个 活动 的 时 间 都 不 一 样 , 如 何 确定 工程 的 最 短 完工 时 间 ? 工程 的 最 短 完工 时 间 取 决 于 这 些 活动 中 
时 间 最 长 的 那 条 关键 活动 路 径 , 从 成 百 上 千 个 活动 中 找 出 关键 路 径 看 似 是 个 无 法 入 手 的 问题 , 但 
是 如 果 将 问题 转化 为 有 向 图 ,顶点 代表 事件 ， 边 代表 活动 ， 边 的 权 代表 活动 时 间 ， 则 可 以 利用 有 
向 图 的 关键 路 径 算法 解决 问题 。 

用 三 个 容积 分 别 为 3 升 、8 升 和 5 升 的 水 桶 如 何 获得 4 升水 的 问题 , 是 一 个 经 典 的 智力 游戏 。 
如 果 让 计算 机 像 人 一 样 思考 并 解决 这 个 问题 有 点 困难 , 但 是 如 果 转 换 思维 , 将 三 个 水 桶 中 当前 的 
水 量 定义 为 一 个 状态 , 将 倒 水 定义 为 一 个 驱动 状态 转换 的 动作 , 则 这 个 问题 就 转换 为 水 桶 状态 的 
穷 举 搜索 问题 。 在 解 空间 中 用 穷 举 的 方法 遍历 所 有 可 能 的 解 ， 并 找到 最 终 合法 的 解 是 解决 最 优 解 
问题 的 常用 数学 模型 ， 只 要 想到 了 这 个 数学 模型 ， 这 个 问题 就 迎刃而解 了 ,在 本 书 的 第 5 章 ， 你 
将 会 看 到 如 何 利用 这 个 数学 模型 解决 倒 水 问题 的 算法 实现 。 

你 可 以 设计 数学 模型 , 但 是 有 时 候 你 也 可 以 像 使 用 模式 一 样 使 用 那些 经 典 的 或 常用 的 数学 模 
型 ， 或 者 根据 不 同 对 象 的 某 些 相似 性 ， 借 用 已 知 领域 的 数学 模型 。 当 我 们 解决 未 知 的 问题 时 ,党 
常 把 已 知 的 旧 问题 当 作 基 础 或 经 验 来 源 。 正 如 艾 萨 克 , 牛顿 说 的 那样 :“ 如 果 我 看 得 比 别 人 远 ， 
那 是 因为 我 站 在 巨人 的 肩膀 上 。” 从 根本 上 讲 ， 把 未 知 的 问题 转化 成 已 知 问题 ， 然 后 再 用 已 知 的 
方法 解决 已 知 问题 ,是 解决 未 知 问题 的 基础 手段 。 但 是 ,如 何 将 一 个 未 知 的 问题 转化 为 我 们 熟知 
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的 数学 模型 是 一 个 复杂 而 艰难 的 过 程 , 完成 这 个 过 程 需要 相当 多 的 经 验 积 累 , 同时 也 是 算法 设计 
中 最 有 趣味 的 部 分 ， 下 面 来 看 一 个 算法 几何 的 例子 。 

判断 n 个 和 矩形 之 间 是 否 存 在 包含 关系 是 经 典 的 算法 儿 何 问题 ,按照 一 般 的 思路 ， 应 该 是 n 个 
矩形 两 两 进行 包含 判断 。 但 是 很 显然 ， 这 个 简单 的 方法 需要 n(n 一) 次 矩形 包含 判断 ， 时 间 复 杂 度 
是 O0)。 如 果 知 道 区 间 树 的 概念 ， 就 可 以 将 这 个 问题 转化 为 区 间 树 的 查询 问题 。 首 先 根据 矩形 的 
几何 位 置 ， 利 用 水 平 边 和 垂直 边 分 别 构造 两 颗 区 间 树 〈 根据 矩形 的 几何 特征 ， 只 需要 处 理 一 条 水 
平 边 和 一 条 垂直 边 即 可 ), 然后 将 n 个 矩形 的 水 平 边 作为 被 查找 元 素 ,依次 在 水 平 边区 间 树 中 查找 ， 
如 果 找 到 其 他 矩形 的 水 平 边 完 整 覆盖 被 查找 矩形 的 水 平 边 ， 则 在 垂直 边区 间 树 上 进一步 判断 该 矩 
形 的 垂直 边 被 覆盖 的 情况 。 如 果 存 在 被 查找 的 矩形 的 水 平 边 和 垂直 边 都 被 同一 个 矩形 的 水 平 边 和 
垂直 边 履 盖 的 情况 ， 则 说 明 这 两 个 矩形 存在 包含 关系 。 采 用 区 间 树 的 算法 复杂 度 是 O(nlg(n))， 额 
外 的 开销 是 建立 区 间 树 的 开销 ,但 是 只 要 n 足够 大 ， 这 个 算法 仍然 比 简单 比较 法 高 效 。 

数据 结构 是 算法 的 基本 工具 , 采用 什么 数据 结构 由 算法 的 数学 模型 决定 , 但 是 各 不 相同 的 数 
据 结构 自身 的 一 些 特 点 反 过 来 也 会 影响 数学 模型 的 选择 。 数 学 模型 是 对 问题 域 的 高 度 抽 象 ， 而 数 
据 结构 又 是 承载 数学 模型 的 基础 。 在 简单 的 算法 中 , 数学 模型 的 定义 有 时 候 可 能 简化 成 数据 结构 
的 定义 ,即便 是 复杂 的 数学 模型 最 终 也 是 要 使 用 相应 定义 的 数据 结构 来 承载 , 所 以 这 二 者 是 亲密 
无 间 的 挛 生 兄弟 ， 它 们 共同 决定 了 算法 的 成 败 。 


2.4 总 结 


本 童 介绍 了 三 部 分 内 容 , 分 别 是 程序 的 基本 结构 、 常 用 数据 结构 及 应 用 方式 以 及 数据 结构 和 
数学 模型 与 算法 的 关系 。 程 序 的 基本 结构 不 需要 特别 强调 ， 因 为 这 应 该 是 每 一 个 程序 员 的 本 能 。 
对 常用 的 数据 结构 的 介绍 也 着 眼 于 这 些 数 据 结 构 的 特点 和 适用 的 场合 , 重点 不 是 原理 , 而 是 如 何 
在 不 同 场 合 下 灵活 使 用 这 些 数 据 结 构 。 数 据 结构 和 数学 模型 与 算法 的 关系 是 不 言 而 喻 的 , 二 者 是 
密 不 可 分 的 , 或 者 是 同一 事物 的 两 个 方面 , 它们 都 是 算法 的 基础 。 像 2.3 节 中 的 例子 , 还 有 很 多 ， 
这 就 是 将 问题 转化 为 适当 的 数学 模型 后 体现 出 来 的 威力 。 对 这 些 常 用 的 数据 结构 的 了 解 和 掌握 ， 
在 很 大 程度 上 决定 了 建立 数学 模型 的 能 力 。 


2.5 参考 资料 


[1] Cormen T H, etal. Introduction to Algorithms (Second Edition). The MIT Press, 2001 
[2] 维基 百科 : http://zh.wikipedia.org/wiki/ 树 _( 数 据 结 构 ) 

[3] 维基 百科 : http://zh.wikipedia.org/wiki/ 图 _( 数 据 结 构 ) 
[ 
[ 


TI 


4] Levitin A. 算法 设计 与 分 析 基 础 . 潘 彦 译 . 北京 : 清华 大 学 出 版 社 ，2007 
5 


Re 


Kleigberg J, Tardos E. Algorithm Design. Addison-Wesley, 2005 


第 章 
算法 设计 的 常用 思想 


本 书 第 1 章 将 算法 设计 描述 为 像 小 宇宙 爆发 一 样 的 智力 活动 的 结果 ， 其 实 是 不 妥当 的 。《 算 
法 设计 》 一 书 的 作者 将 算法 设计 定义 为 一 个 这 样 的 设计 过 程 : 从 广泛 的 计算 机 应 用 中 提出 问题 开 
始 ， 建 立 在 对 算法 设计 技术 理解 的 基础 上 ， 并 最 终 发 展 成 对 这 些 问 题 的 有 效 解 决口 。 从 这 个 意义 
上 理解 , 算法 确实 是 一 次 智力 活动 的 结果 , 但 是 并 不 是 毫 无 章法 的 爆发 ， 它 应 该 是 遵循 一 定 规律 
的 智力 活动 。 首 移 , 它 需 要 一 些 基 础 性 的 知识 作为 这 种 智力 活动 的 着 力 点 ， 比 如 数据 结构 。 其 次 ， 
它 需 要 对 问题 域 做 充分 的 分 析 和 研究 , 高 度 概括 并 抽象 出 问题 的 精确 描述 , 也 就 是 各 种 建立 数学 
模型 的 方法 。 最 后 ， 有 一 些 常用 的 模式 和 原则 ， 可 以 作为 构造 算法 的 选择 项 ， 有 人 称 之 为 算法 设 
计 方法 ,我 建议 称 之 为 算法 设计 模式 或 算法 设计 思想 ， 以 便 将 其 与 一 些 具体 的 算法 名 称 区 分 开 。 

模式 作为 算法 演进 的 一 些 固 定 的 思路 , 提供 了 一 些 构造 算法 的 常用 思想 , 本章 将 介绍 几 种 典 
型 的 算法 设计 模式 , 每 种 模式 都 适合 解决 一 类 特定 的 问题 , 每 种 模式 都 配合 一 个 具体 的 例子 做 说 
明 ， 通 过 实例 介绍 这 种 设计 思想 的 适用 原则 。 


3.1 贪 梦 法 


贪 禁 法 ( greedy algorithm )， 又 称 贪心 算法 ， 是 寻找 最 优 解 问 题 的 常用 方法 。 这 种 方法 模式 
一 般 将 求解 过 程 分 成 若干 个 步 又, 在 每 个 步骤 都 应 用 贪心 原则 , 选取 当前 状态 下 最 好 的 或 最 优 的 
选择 〈 局 部 最 有 利 的 选择 )， 并 以 此 希望 最 后 堆 钱 出 的 结果 也 是 最 好 或 最 优 的 解 。 贪 禁 法 的 每 次 
决策 都 以 当前 情况 为 基础 并 根据 某 个 最 优 原则 进行 选择 ,不 从 整体 上 考虑 其 他 各 种 可 能 的 情况 。 
一 般 来 说 ,这 种 贪心 原则 在 各 种 算法 模式 中 都 会 体现 , 单独 作为 一 种 方法 来 说 明 ， 是 因为 贪 禁 法 
对 于 特定 的 问题 是 非常 有 效 的 方法 。 

贪 禁 法 和 动态 规划 法 以 及 分 治 法 一 样 , 都 需要 对 问题 进行 分 解 , 定义 最 优 解 的 子 结构 。 但是， 
贪 焚 法 与 其 他 方法 最 大 的 不 同 在 于 ， 贪 焚 法 每 一 步 选 择 完 之 后 ， 局 部 最 优 解 就 确定 了 , 不 再 进行 
回溯 处 理 ， 也 就 是 说 ， 每 一 个 步骤 的 局 部 最 优 解 确定 以 后 ， 就 不 再 修改 ， 直 到 算法 结束 。 因 为 不 
进行 回溯 处 理 ， 贪 焚 法 只 在 很 少 的 情况 下 可 以 得 到 真正 的 最 优 解 ， 比 如 最 短路 径 问 题 、 图 的 最 小 
生成 树 问 题 。 大 多 数 情况 下 ， 由 于 选择 策略 的 “短视 ”， 贪 焚 法 会 错过 真正 的 最 优 解 ， 得 不 到 问 
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题 的 真正 答案 。 但 是 贪 焚 法 简单 高 效 ， 省 去 了 为 找 最 优 解 可 能 需要 的 穷 举 操 作 ,， 可 以 得 到 与 最 优 
解 比较 接近 的 近似 最 优 解 ， 通 常 作为 其 他 算法 的 辅助 算法 使 用 。 


3.1.1 贪 梦 法 的 基本 思想 

贪 焚 法 的 基本 设计 思想 有 以 下 三 个 步骤。 

(1) 建立 对 问题 精确 描述 的 数学 模型 ， 包 括 定义 最 优 解 的 模型 ; 

(2) 将 问题 分 解 为 一 系列 子 问题 ， 同 时 定义 子 问 题 的 最 优 解 结构 ; 

(3) 应 用 贪心 原则 确定 每 个 子 问题 的 局 部 最 优 解 ， 并 根据 最 优 解 的 模型 ， 用 子 问题 的 局 部 最 
优 解 堆 秋 出 全 局 最 优 解 。 

定义 最 优 解 的 模型 通常 和 定义 子 问 题 的 最 优 解 结构 是 同时 进行 的 , 最 优 解 的 模型 一 般 都 体现 
了 最 优 解 子 问题 的 分 解 结 构 和 堆 秋 方式 。 对 于 子 问 题 的 分 解 有 多 种 方式 , 有 的 问题 可 以 按照 问题 
的 求解 过 程 一 步 一 步 地 进行 分 解 , 每 一 步 都 在 前 一 步 的 基础 上 选择 当前 最 好 的 解 , 每 做 一 次 选择 
就 将 问题 简化 为 一 个 规模 更 小 的 子 问题 ， 当 最 后 一 步 的 求解 完成 后 就 得 到 了 全 局 最 优 解 。 还 有 的 
问题 可 以 将 问题 分 解 成 相对 独立 的 几 个 子 问 题 , 对 每 个 子 问题 求解 完成 后 再 按照 一 定 的 规则 ( 比 
如 某 种 公式 或 计算 法 则 ) 将 其 组 合 起 来 得 到 全 局 最 优 解 。 


这 里 说 的 定义 子 问题 分 解 和 子 问 题 的 最 优 解 结构 可 能 有 点 抽象 ， 我 们 来 看 一 个 具体 的 例子 。 
找 零 钱 是 一 个 经 典 的 例子 ,假如 某国 发 行 的 货币 有 25 分 、10 分 、5 分 和 1 分 四 种 硬币 ， 假 如 你 
是 售货员 ， 你 要 找 给 客户 41 分 钱 的 硬币 ， 如 何 安排 能 使 得 找 给 客人 的 钱 正 确 ， 但 是 硬币 个 数 最 
少 。 这 个 问题 的 子 问 题 定 义 就 是 从 四 种 币值 的 硬币 中 选择 一 枚 , 使 这 个 硬币 的 币值 和 其 他 已 经 选 
择 的 硬币 的 币值 总 和 不 超过 41 分 钱 。 子 问题 的 最 优 解 结构 就 是 在 之 前 的 步骤 中 已 经 选择 的 硬币 
加 上 当前 选择 的 一 枚 硬币 ， 当 然 ， 选 择 的 策略 是 贪 焚 策 略 ， 即 在 币值 总 和 不 超过 41 的 前 提 下 选 
择 币 值 最 大 的 那 种 硬币 。 按 照 这 个 策略 ， 第 一 次 选择 25 分 的 硬币 一 枚 ,第 二 次 选择 10 分 的 硬币 
一 枚 ， 第 三 次 选择 5 分 的 硬币 一 枚 ， 第 四 次 选择 1 分 的 硬币 一 枚 ， 总 共 需 要 4 枚 硬币 。 

上 面 的 例子 得 到 的 确实 是 一 个 最 优 解 , 但 是 很 多 情况 下 贪 禁 法 都 不 能 得 到 最 优 解 。 同 样 以 找 
零钱 为 例 ， 假 如 某国 发 行 的 货币 是 25 分 、20 分 、5 分 和 1 分 四 种 硬币 ,这 时 候 找 41 分 钱 的 最 优 
策略 是 2 枚 20 分 的 硬币 加 一 枚 1 分 硬币 共 3 枚 硬币 , 但 是 用 贪 禁 法 得 到 的 结果 却 是 1 枚 25 分 硬 
币 ， 三 枚 5 分 硬币 和 一 枚 1 分 硬币 共 5 枚 硬币 。 


3.1.2 ” 贪 禁 法 的 例子 : 0-1 背包 问题 


本 节 介 绍 一 个 贪 梦 法 的 经 典 例子 一 一 0-1 背包 问题 有 N 件 物品 和 一 个 承重 为 C 的 背包 ( 也 
可 定义 为 体积 )， 每 件 物品 的 重量 是 w;， 价 值 是 p;， 求解 将 哪 几 件 物品 装 入 背包 可 使 这 些 物 品 在 
重量 总 和 不 超过 C 的 情况 下 价值 总 和 最 大 。 背 包 问 题 ( knapsack problem ) 是 此 类 组 合 优化 的 NP 
完全 问题 的 统称 ， 比 如 货 箱 装载 问题 、 货 船 载 物 问 题 等 ， 因 问题 最 初 来 源 于 如 何 选 择 最 合适 的 物 
品 装 在 背包 中 而 得 名 。 这 个 问题 隐 含 了 一 个 条 件 ,， 每 个 物品 只 有 一 件 ,也 就 是 限定 每 件 物品 只 能 
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选择 0 个 或 1 个 ， 因 此 又 被 称 为 0-1 背包 问题 。 

来 看 一 个 具体 的 例子 ， 有 一 个 背包 , 最 多 能 承载 重量 为 C=150 的 物品 , 现在 有 7 个 物品 ( 物 
品 不 能 分 割 成 任意 大 小 )， 编 号 为 1 ~7， 重 量 分 别 是 w=[35,30,60,50,40,10,25] ， 价 值 分 别 是 
p 产 [10,40,30,50,35,40,30]， 现 在 从 这 7 个 物品 中 选择 一 个 或 多 个 装 入 背包 ， 要 求 在 物品 总 重量 不 
超过 C 的 前 提 下 , 所 装 和 的 物品 总 价值 最 高 。 这 个 问题 的 子 问题 可 以 按照 选择 物品 装 入 背包 的 过 
程 按部就班 地 一 步 一 步 分 解 ， 将 子 问题 定义 为 在 被 背包 容量 还 有 C" 的 情况 下 ， 选 择 一 个 物品 装 
和 人 背包。C" 的 初始 值 就 是 130， 假 如 选择 了 一 个 重 为 35 的 物品 ， 则 子 问题 就 变 成 在 背包 容量 C' 
是 115 的 情况 下 ， 从 剩 下 的 6 件 物品 中 选择 一 个 物品 ， 这样 每 选择 一 个 物品 就 相当 于 子 问题 的 规 
模 减 小 了 。 

那么 如 何 选择 物品 呢 ? 这 就 是 贪 焚 策 略 的 选择 问题 。 对 于 本 题 ， 常见 的 贪 焚 策 略 有 三 种 。 第 
一 种 策略 是 根据 物品 价值 选择 , 每 次 都 选 价值 最 高 的 物品 。 根据 这 个 策略 最 终 选 择 装 入 背包 的 物 
品 编号 依次 是 4、2、6、5， 此 时 包 中 物品 总 重量 是 130， 总 价值 是 165。 第 二 种 策略 是 根据 物品 
重量 选择 ， 每 次 都 选择 重量 最 轻 的 物品 。 根 据 这 个 策略 最 终 选 择 装 入 背包 的 物品 编号 依次 是 6、 
7、2、1、5， 此 时 包 中 物品 总 重量 是 140， 总 价值 是 155。 第 三 种 策略 是 定义 一 个 价值 密度 的 概 
念 ， 每 次 选择 都 选 价值 密度 最 高 的 物品 。 物 品 的 价值 密度 s; 定 义 为 pywi;， 这 7 件 物品 的 价值 密度 
站 别 为 s 产 [0.286,1.333,0.5,1.0,0.875,4.0,1.2]。 根 据 这 个 策略 最 终 选 择 装 入 背包 的 物品 编号 依次 是 
6、2、7、4、1， 此 时 包 中 物品 的 总 重量 是 130， 总 价值 是 170。 

根据 前 文 的 分 析 结 果 ， 我 们 给 出 贪 禁 法 解决 背包 问题 的 算法 实现 。 首 先 定义 背包 问题 的 数 
据 结构 ， 根 据 问题 描述 ， 可 以 直接 知道 每 个 物品 有 两 个 属性 ， 分 别 是 重量 和 价值 。 此 外 ， 每 个 
物品 只 能 被 选择 一 次 ， 因 此 还 需要 给 每 个 物品 增加 一 个 选择 状态 的 属性 ， 因 此 物品 的 数据 结构 
定义 如 下 : 

typedef struct tagObject 


int weight; 

int price; 

int status; //0: 未 选中 ; 1: 已 选中 ; 2: 已 经 不 可 选 
}OBJECT; 


需要 特别 说 明 的 是 状态 值 为 2 的 情况 , 这 种 情况 表示 用 当前 策略 选择 的 物品 导致 总 重量 超过 
承重 量 , 在 这 种 情况 下 ， 如 果 放 弃 这 个 物品 ,按照 策略 从 剩 下 的 物品 中 再 选 一 个 ,有 可 能 就 
能 满足 背包 承重 的 要 求 。 因 此 , 设置 了 一 个 状态 2， 表 示 当 前 选择 物品 不 合适 ， 下 次 选择 也 不 要 
再 选 这 个 物品 了 。 接 下 来 是 背包 问题 的 定义 ， 背包 问题 包括 两 个 属性 , 一 个 是 可 选 物品 列表 , 一 
个 是 青 包 总 的 承重 量 。 简 单 定义 背包 问题 数据 结构 如 下 : 


typedef struct tagknapsackProblem 
{ 


std: :vector<OBJECT> objs; 
int totalC; 
}KNAPSACK_PROBLEM; 


3.1 贪 禁 法 号 29 


GreedyAlgo() 函 数 是 贪 焚 算 法 的 主体 结构 ， 包 括 子 问 题 的 分 解 和 选择 策略 的 选择 都 在 这 个 函 
数 中 。 正 如 函数 所 展示 的 那样 ， 它 可 以 作为 此 类 问题 的 一 个 通用 解决 思路 。 


void GreedyAlgo(KNAPSACK_ PROBLEM *problem, SELECT POLICY spFunc) 


int idx; 
int ntc = 0; 
//spFunc 每 次 选 最 符合 策略 的 那个 物品 ， 选 后 再 检查 


while((idx = spFunc(problem->objs, problem->totalC - ntc)) != -1) 
{ 


// 所 选 物品 是 否 满足 背包 承重 要 求 ? 
if((ntc + problem->objs[idx].weight) <= problem->totalC) 


problem->objs[idx].status = 1; 
ntc += problem->objs[idx].weight; 
} 


else 


// 不 能 选 这 个 物品 了 ， 做 个 标记 后 重新 选 
problem->objs[idx].status = 2; 
} 
} 


PrintResult(problem->objs); 
} 
spFunc 参数 是 选择 策略 函数 的 接口 , 通过 替换 这 个 参数 , 可 以 实现 上 文 提 到 的 三 种 贪 禁 策略 ， 
分 别 得 到 各 种 贪 禁 策 略 下 得 到 的 解 。 以 第 一 种 策略 为 例 ， 可 以 这 样 实现 : 


int Choosefunc1i(std::vector<OBJECT>& objs, int c) 


{ 
int index = -1; 
int mp = 0; 
for(int i = 0; i < static cast<int>(objs.size()); i++) 
{ 
if((objs[il].status == 0) 8& (objs[i].price > mp)) 
{ 
mp = objs[i].price; 
index = i; 
} 
} 
return index; 
} 


看 起 来 第 三 种 策略 取得 了 最 好 的 结果 ,和 动态 规划 方法 得 到 的 最 优 结果 是 一 致 的 。 但 是 实际 
上 ， 这 只 是 对 这 组 数据 的 验证 结果 而 已 ， 如 果 换 一 组 数据 ， 结 果 可 能 完全 相反 。 当 然 ， 对 于 一 些 
能 够 证 明 贪 禁 策 略 得 到 的 就 是 最 优 解 的 问题 , 应 用 贪 禁 法 可 以 高 效 地 求 得 结果 ,比如 求 最 小 生成 
树 的 Prim 算法 和 Kruskal 算法 。 大 多 数 情况 下 , 贪 禁 法 只 能 得 到 比较 接近 最 优 解 的 近似 的 最 优 解 ， 
但 是 作为 一 种 启发 式 辅助 方法 ， 它 常用 于 其 他 算法 中 ， 比 如 Dijkstra 的 单 源 最 短路 径 算法 。 事 实 
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上 , 在 任何 算法 中 ,只 要 在 某 个 阶段 使 用 了 只 考虑 局 部 最 优 情况 的 选择 策略 ， 都 可 以 理解 为 使 用 
了 贪 焚 算法 。 


3.2 “分 治 法 


分 治 ， 顾 名 思 义 ， 分 而 治之 。 分 治 法 ( divide and conquer ) 也 是 一 种 解决 问题 的 常用 模式 ， 
分 治 法 的 设计 思想 是 将 无 法 着 手 解 决 的 大 问题 分 解 成 一 系列 规模 较 小 的 相同 问题 , 然后 逐个 解决 
小 问题 ， 即 所 谓 的 分 而 治之 。 分 治 法 产生 的 子 问 题 与 原始 问题 相同 ， 只 是 规模 减 小 , 反复 使 用 分 
治 方法 ， 可 以 使 得 子 问 题 的 规模 不 断 减 小 ， 直 到 能 够 被 直接 求解 为 止 。 

分 治 法 作为 算法 设计 中 一 个 古老 的 策略 ,在 很 多 问题 中 得 到 了 广泛 的 应 用 ， 比 如 最 大 、 最 小 
问题 ( 例如 在 一 堆 形状 相同 的 物品 中 找 出 最 重 或 最 轻 的 那 一 个 )， 和 矩阵 乘法 、 大 整数 乘法 以 及 排 
序 ( 例如 快速 排序 和 归并 排序 )。 除 此 之 外 ， 这 个 技巧 也 是 许多 高 效 算法 的 基础 ， 比 如 快速 傅 里 
叶 变 换算 法 和 Karatsuba 乘法 算法 。 

应 用 分 治 法 , 一般 出 于 两 个 目的 : 一 是 通过 分 解 问题 ， 使 无 法 着 手 解决 的 大 问题 变 成 容易 解 
决 的 小 问题 ; 二 是 通过 减 小 问题 的 规模 , 降低 解决 问题 的 复杂 度 (或 计算 量 )。 给 1000 个 数 排序 ， 
可 能 会 因为 问题 的 规模 太 大 而 无 从 下 手 , 但 是 如 果 减 小 这 个 问题 的 规模 ,将 问题 一 分 为 二 ， 变 成 
分 别 对 两 个 拥有 500 个 数 的 序列 排序 ， 然 后 再 将 两 个 排序 后 的 序列 合并 成 一 个 就 得 到 了 1000 个 
数 的 排序 结果 。 对 500 个 数 排序 仍然 无 法 下 手 ， 需 要 继续 分 解 ， 直 到 最 后 问题 的 规模 变 成 2 个 数 
排序 的 时 候 ， 只 需要 一 次 比较 就 可 以 确定 顺序 。 这 正 是 快速 排序 的 实现 思想 ,通过 减 小 问题 的 规 
模 使 问题 由 难以 解决 变 得 容易 解决 。 计 算 NW 个 采样 点 的 离散 傅 里 叶 变 换 , 需要 做 入 次 复数 乘法 ， 
但 是 将 其 分 解 成 两 个 W2 个 采样 点 的 离散 傅 里 叶 变 换 ， 则 只 需要 做 (N/2)+(N/2)》 = N12 次 复数 乘 
法 , 做 一 次 分 解 就 使 得 计算 量 减少 了 一 半 , 这 正 是 快速 傅 里 叶 变 换 的 实现 思想 ,通过 减 小 问题 的 
规模 减少 计算 量 ， 降 低 问 题 的 复杂 度 。 


3.2.1 分 治 法 的 基本 思想 


很 多 情况 下 ,分 治 法 都 会 使 用 递归 的 方式 对 问题 逐 级 分 解 , 但 是 在 每 个 子 问题 的 层面 上 , 分 
治 法 基本 上 可 以 归纳 为 以 下 三 个 步骤 。 

(1) 分 解 : 将 问题 分 解 为 若干 个 规模 较 小 ， 相 互 独立 上 且 与 原 问题 形式 相同 的 子 问题 ， 确 保 各 
个 子 问题 的 解 具有 相同 的 子 结构 。 

(2) 解决 : 如 果 上 一 步 分 解 得 到 的 子 问题 可 以 解决 ， 则 解决 这 些 子 问题 ， 否 则 ， 对 每 个 子 问题 
使 用 和 上 一 步 相同 的 方法 再 次 分 解 ， 然 后 求解 分 解 后 的 子 问 题 ， 这 个 过 程 可 能 是 一 个 递归 的 过 程 。 

(3) 合并 : 将 上 一 步 解决 的 各 个 子 问题 的 解 通过 某 种 规则 合并 起 来 ， 得 到 原 问题 的 解 。 

分 治 法 的 实现 模式 可 以 是 递归 方式 , 也 可 以 是 非 递 归 方 式 , 一 般 采 用 递归 方式 的 算法 模式 可 
以 用 伪 代 码 描述 为 : 
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T DivideAndConquer(P) 
{ 
if(P 可 以 直接 解决 ) 
{ 
T <- P 的 结果 ; 
return T; 
} 


将 P 分 解 为 子 问 题 {P1，P2,...，Pn}; 
for each(Pi : {P1, P2,..., Pn}) 
{ 


ti <- DivideAndConquer(Pi); // 递 归 解 决 子 问题 Pi 
} 
T <- Merge(t1，t2,...,tn); // 合 并 子 问题 的 解 


return T; 


题 ,， 通常 有 不 同 的 分 解 与 合并 的 方式 。 


口 快速 排序 算法 的 分 解 思想 是 选择 一 个 标兵 数 ， 将 待 排序 的 序列 分 成 两 个 子 序列 ， 其 中 一 
个 子 序列 中 的 数 都 小 于 标兵 数 ， 另 一 个 子 序列 中 的 数 都 大 于 标兵 数 ， 然 后 分 别 对 这 两 个 
子 序 列 排序 ， 其 合并 思想 就 是 将 两 个 已 经 排序 的 子 序列 一 前 一 后 拼接 在 标兵 数 前 后 ， 组 
成 一 个 完整 的 有 序 序列 。 

口 快速 傅 里 叶 变换 的 分 解 思想 是 将 一 个 V 点 离散 传 里 叶 变换 , 按照 奇偶 关系 分 成 两 个 N/2 点 
离散 傅 里 叶 变换 , 其 合并 思想 就 是 将 两 个 N/2 点 离散 传 里 叶 变换 的 结果 按照 蝶 形 运算 的 位 
置 关系 重新 排列 成 一 个 W 点 序列 。 

口 Karatsuba 乘法 算法 的 分 解 思想 是 将 n 位 大 数 分 成 两 部 分 : a+p， 其 中 是 整数 寡 ， 然 后 利 
用 乘法 的 分 解 公式 : (atb)(ctqd)=actadt+bctbd， 将 其 分 解 为 四 次 小 规模 大 数 的 乘法 计算 ， 
然后 利用 一 个 小 技巧 将 其 化 解 成 三 次 乘法 和 少量 移 位 操作 。 最 终结 果 的 合并 思想 就 是 用 
几 次 加 法 对 小 规模 乘法 的 结果 进行 求 和 ， 得 到 原始 问题 的 解 。 

由 以 上 例子 可 知 , 分 治 法 最 难 也 是 最 灵活 的 部 分 就 是 对 问题 的 分 解 和 结果 的 合并 。 对 于 一 个 
未 知 的 问题 ， 只 要 能 找到 对 子 问题 的 分 解 方式 和 结果 的 合并 方式 ， 应 用 分 治 法 就 可 以 迎刃而解 。 
而 在 数学 上 ， 只 要 是 能 用 数学 归纳 法 证 明 的 问题 , 一 般 都 可 以 应 用 分 治 法 解决 , 这 也 是 一 个 应 用 
分 治 法 的 强烈 信号 。 


3.2.2 ”递归 和 分 治 ， 一 对 好 朋友 


递归 作为 一 种 算法 的 实现 方式 , 与 分 治 法 天 生 是 一 对 好 朋友 。 问题 的 分 解 肯定 不 是 一 步 到 位 
的 , 需要 反复 使 用 分 治 手 段 ,在 多 个 层次 上 层 层 分 解 , 这 种 分 解 的 方法 很 自然 地 导致 了 递归 方式 
的 使 用 。 从 算法 实现 的 角度 看 , 分 治 法 得 到 的 子 问题 和 原 问 题 是 相同 的 ， 当 然 可 以 用 相同 的 函数 
来 解决 ,区别 只 在 于 问题 的 规模 和 范围 不 同 。 通过 特定 的 函数 参数 安排 ,使 得 同一 个 函数 可 以 解 
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决 不 同 规模 的 相同 问题 ， 这 就 是 递归 方法 的 基础 。 

以 快速 排序 为 例 , 如 果 把 待 排 序 的 序列 作为 问题 的 话 , 那么 子 问题 的 规模 就 可 以 定义 为 子 序 
列 在 原始 序列 中 的 起 始 位 置 。 对 此 一 般 化 之 后 , 原始 问题 和 子 问 题 的 描述 就 统一 了 ,都 是 原始 序 
列 + 起 始 位 置 ， 原 始 问题 的 起 始 位 置 就 是 [1 四 ， 子 问题 的 起 始 位 置 就 是 [1 四 中 的 某 一 个 子 区 间 ， 
此 一 来 ， 递 归 的 接口 就 明确 了 : 

void quick sort(int *arElem, int p, int r) 
其 中 , p 和 + 分别 是 子 序列 在 arElem 中 的 起 始 位 置 ， 有 了 子 问题 的 递归 定义 接口 ， 快 速 排 序 
的 算法 实现 也 就 水 到 渠 成 了 : 


void quick sort(int *arElem, int p, int r) 


if(p < r) 
{ 


int mid = partion(arElem, p, r); 
quick sort(arElem, p, mid - 1); 
quick sort(arElem, mid + 1, r); 
} 
} 


不 用 递归 是 不 是 就 不 能 用 分 治 法 了 ? 当然 不 是 , 快速 傅 里 叶 变 换算 法 就 没有 用 递归 。 很 多 算 
法 都 有 自己 的 非 递 归 实 现 方式 , 是 否 使 用 了 递归 方法 不 是 判断 是 否 是 分 治 法 的 必要 条 件 。 即 便 是 
一 些 使 用 了 递归 方法 的 算法 , 也 都 可 以 用 一 个 自己 构造 的 栈 将 其 改编 为 非 递归 方法 ,比如 快速 排 
序 就 有 很 多 用 栈 实 现 的 非 递归 方法 。Robert Sedgewick 在 其 著作 41gorithm in C 一 书 中 就 给 出 了 一 
种 快速 排序 的 非 递 归 高 效 算法 。 有 兴趣 的 读者 可 阅读 此 书 ， 了 解 一 下 算法 的 实现 。 


3.2.3 ”分 治 法 的 例子 ， 大 整数 Karatsuba 乘法 算法 

两 个 ”位 大 整数 相 乘 ， 普 通 乘法 算法 的 时 间 复 杂 度 一 般 是 O(n”)。 但 是 Anatolii Alexeevitch 
Karatsuba 博士 在 1960 年 提出 了 一 种 时 间 复 杂 度 是 O(3n"“””) (1.585=log23 ) 的 快速 乘法 算法 ， 这 
就 是 Karatsuba 乘法 算法 。 该 算法 就 是 利用 了 分 治 法 的 思想 ,将 n 位 大 整数 分 解 成 两 个 接近 nm/2 
位 的 大 整数 ， 通 过 3 次 n/2 位 大 整数 的 乘法 和 少量 加 法 操作 ， 避 人 免 了 直接 进行 n 位 大 整数 乘法 计 
算 ， 有效 地 降低 了 乘法 计算 的 计算 量 。 

Karatsuba 乘法 算法 的 原理 非常 简单 ， 假 如 有 两 个 n 位 的 M 进 制 大 整数 x，y， 利 用 一 个 小 于 
n 的 正 数 (通常 的 取 值 为 n/2 左右 )， 将 x 和 yy 分 解 为 两 个 部 分 : 

a 2 TXo 


了 =J + yo 


则 x 和 的 乘积 可 计算 为 : 
y= ME + xoO( VM + po) =xyME + riyo + xoy M+ xoyo 
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这 样 就 将 x 和 ?的 乘法 计算 转化 成 四 次 较 小 规模 的 乘法 计算 和 少量 的 加 法 计算 ， 其 中 MX* 和 
1 天 的 计算 都 可 以 通过 移 位 高 效 地 处 理 。 不 过 上 述 操作 还 可 以 继续 优化 ,我 们 令 zo=xqyo，zi=xiyo+ 
xo01，22= xD1， 则 xy 的 乘积 可 表示 为 : 


xy = z+ ziM + zo 
计算 z 需 要 两 次 乘法 ， 对 zi 的 计算 可 以 优化 为 : 
21= (X1 + Xo)Y1 + y0) — Xp1 — Xoyo = (X1+ Xo)y1 + yo0) — 22—Z0 
由 于 zo 和 zs 都 已 经 计算 过 了 ， 因 此 就 只 需 一 次 乘法 ， 辅 助 两 次 加 法 和 两 次 减法 即 可 计算 出 
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根据 以 上 分 析 ，Karatsuba 乘法 算法 对 子 问 题 的 分 解 就 是 将 大 整数 分 成 高 位 和 低位 两 个 部 分 ， 
然后 利用 优化 后 的 计算 公式 计算 出 最 后 的 结果 , 而 这 个 计算 公式 就 是 结果 的 合并 部 分 。 本 书 的 第 
17 章 会 介绍 大 整数 相关 算法 ,其 中 的 cBigInt 类 就 是 一 个 n 位 的 2” 进 制 大 数 , 可 以 理解 为 M=2”， 
利用 cBigInt 类 的 实现 ， 我们 给 出 n 位 的 2” 了 进 制 大 数 的 Karatsuba 乘法 算法 实现 : 


CBigInt Karatsuba(const CBigInt& mul1, const CBigInt& mul2) 
{ 


//1 位 大 整数 ， 直 接 计 算 ， 这 也 是 递归 的 终止 条 件 
if((mul1.GetBigNCount() == 1) || (mul2.GetBigNCount() == 1)) 
{ 


} 
// 问 题 分 解 
CBigInt high1,high2,1ow1,1ow2; 

unsigned int k = max(mul1.GetBigNCount(), mul2.GetBigNCount()) / 2; 
high1 = mul1; 
high1.GetRightBigN(k, low1); 
high1.ShiftRightBigN(k); 
high2 = mul2; 
high2.GetRightBigN(k, low2); 
high2.ShiftRightBigN(k); 
CBigInt z0 = Karatsuba(low1, low2); 

CBigInt z1 = Karatsuba((low1 + high1), (low2 + high2)); 
CBigInt z2 = Karatsuba(high1, high2); 

// 结 果 合并 

CBigInt zk = z1 - z2 - 2z0; 

z2.ShiftLeftBigN(2 * k); 

zk.ShiftLeftBigN(k); 


return mu11 * mul2; 


return (z2 + zk + 2z0); 


} 

CBigInt::GetBigNCount() 函 数 计算 大 整数 的 位 数 ， 是 以 2 为 进 制 的 位 数 ，K 作为 分 解 位 数 ， 
是 两 个 大 数 的 位 数 的 一 半 , 将 高 位 和 低位 分 别 取 出 进行 计算 。 其 中 三 次 乘法 计算 继续 利用 分 治 的 
思想 进行 处 理 , 当 问 题 的 规模 减少 到 1 位 大 整数 时 就 可 以 直接 计算 了 , 递归 调用 Karatsuba() 函数 
体现 了 这 种 思想 。 


34 区 第 3 章 算法 设计 的 常用 思想 


3.3 ”动态 规划 


动态 规划 (dynamic programming ) 是 解决 多 阶段 决策 问题 常用 的 最 优化 理论 , 该 理论 由 美国 
数学 家 Bellman 等 人 在 1957 年 提出 ， 用 于 研究 多 阶段 决策 过 程 的 优化 问题 。 该 理论 提出 后 ， 立 
即 在 数学 、 计 算 机 科学 、 经 济 管理 和 工程 技术 领域 得 到 了 广泛 的 应 用 , 例如 最 短路 线 、 库 存 管理 、 
资源 分 配 、 设 备 更 新 、 排 序 、 装 载 等 问题 ， 用 动态 规划 方法 往往 比 朴素 的 方法 更 高 效 。 动 态 规划 
方法 的 原理 就 是 把 多 阶段 决策 过 程 转化 为 一 系列 的 单 阶段 决策 问题 , 利用 各 个 阶段 之 间 的 递 推 关 
系 ， 逐 个 确定 每 个 阶段 的 最 优化 决策 ， 最 终 堆 私 出 多 阶段 决策 的 最 优化 决策 结果 。 

动态 规划 比 穷 举 高 效 ， 这 一 点 在 很 多 情况 下 都 得 到 了 印证 , 这 常常 给 人 一 种 错觉 ,以 为 它 是 
高 效 的 多 项 式 时 间 算 法 , 但 事实 并 非 如 此 。 应 用 动态 规划 法 解 题 的 效率 ,取决 于 问题 的 类 型 ， 并 
不 是 任何 情况 下 使 用 动态 规划 法 都 有 最 高 的 效率 。 比 如 很 多 NP 问题 ， 也 可 以 设计 用 动态 规划 法 
解决 。 在 这 种 情况 下 ， 动态 规划 法 就 不 是 一 种 多 项 式 时 间 的 方法 ,而 是 一 种 穷 举 ， 其 效率 就 是 指 
数 时 间 复 杂 度 。 反 过 来 理解 这 个 问题 也 是 一 样 的 ， 很 多 NP 问题 可 以 使 用 动态 规划 方法 求解 ， 如 
果 简 单 地 认为 动态 规划 是 一 种 多 项 式 方法 ， 那 难道 这 些 问 题 就 不 再 是 NP 问题 了 ? 

Kleigberg 在 他 的 《算法 设计 》 一 书 中 也 对 这 个 问题 进行 了 讨论 ， 他 认为 动态 规划 法 通过 将 
问题 细 分 为 一 系列 子 问 题 , 从 而 隐 含 地 探查 了 所 有 可 行 解 的 空间 , 于 是 我 们 可 以 从 某 种 程度 上 把 
动态 规划 看 作 接 近 暴 力 搜索 边 缘 的 危险 操作 。 对 于 多 项 式 时 间 的 问题 ,动态 规划 法 可 能 得 到 多 项 
式 时 间 复 杂 度 的 高 效 算 法 ， 但 是 对 于 NP 问题 ， 动 态 规划 法 也 只 能 得 到 指数 时 间 复 杂 度 的 算法 。 
Kleigberg 认为 ， 动 态 规划 对 子 问题 的 处 理 方式 使 得 它 可 以 遍历 问题 可 行 解 的 指数 规模 的 集合 ， 
甚至 可 以 在 没有 明确 地 检查 所 有 解 的 情况 下 就 做 到 这 一 点 。 可 以 认为 这 是 因为 动态 规划 拥有 比 穷 
举 更 高 效 的 剪 枝 判 断 ， 这 是 一 种 对 重 妥 子 问题 ( 子 问题 包含 子 子 问题 ) 处 理 的 内 在 机 制 。 

每 种 方法 都 有 自身 的 局 限 性 ， 动 态 规划 法 也 不 是 万 能 的 。 动 态 规划 适合 求解 多 阶段 ( 状态 转 
换 ) 决策 问题 的 最 优 解 ， 也 可 用 于 含有 线性 或 非 线性 递 推 关系 的 最 优 解 问 题 ， 但 是 这 些 问 题 都 必 
须 满足 最 优化 原理 和 子 问题 的 “无 后 向 性 ”。 

口 最 优化 原理 : 最 优化 原理 其 实 就 是 问题 的 最 优 子 结构 的 性 质 ， 如 果 一 个 问题 的 最 优 子 结 

构 是 不 论 过 去 状态 和 决策 如 何 ， 对 前 面 的 决策 所 形成 的 状态 而 言 ， 其 后 的 决策 必须 构成 
最 优 策 略 。 也 就 是 说 ， 不 管 之 前 决策 是 否 是 最 优 决策 ， 都 必须 保证 从 现在 开始 的 决策 是 
在 之 前 决策 基础 上 的 最 优 决 策 ， 则 这 样 的 最 优 子 结构 就 符合 最 优化 原理 。 

口 无 后 向 性 (无 后 效 性 ) : 所 谓 “ 无 后 向 性 ”， 就 是 当 各 个 阶段 的 子 问 题 确定 以 后 ， 对 于 某 
个 特定 阶段 的 子 问题 来 说 ， 它 之 前 的 各 个 阶段 的 子 问 题 的 决策 只 影响 该 阶段 的 决策 ， 对 
该 阶段 之 后 的 决策 不 产生 影响 ， 也 就 是 说 ， 每 个 阶段 的 决策 仅 受 之 前 决策 的 影响 ,但 是 

影响 之 后 各 阶段 的 决策 。 


3.3.1 动态 规划 的 基本 思想 
和 分 治 法 一 样 , 动态 规划 解决 复杂 问题 的 思路 也 是 对 问题 进行 分 解 , 通过 求解 小 规模 的 子 问 
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题 再 反 推出 原 问 题 的 结果 。 但 是 动态 规划 分 解 子 问题 不 是 简单 地 按照 “大 事 化 小 ”的 方式 进行 的 ， 
而 是 沿 着 决策 的 阶段 划分 子 问 题 ,决策 的 阶段 可 以 随时 间 划 分 ,也 可 以 随 着 问题 的 演化 状态 划分 。 
分 治 法 要 求 子 问题 是 互相 独立 的 ,以 便 分 别 求解 并 最 终 合 并 出 原始 问题 的 解 , 但 是 动态 规划 法 的 
子 问题 不 是 互相 独立 的 , 子 问 题 之 间 通 常 有 包含 关系 ,其 至 两 个 子 问题 可 以 包含 相同 的 子 子 问题 。 
比如 ， 子 问题 A 的 解 可 能 由 子 问题 C 的 解 递 推 得 到 ， 同 时 ， 子 问题 B 的 解 也 可 能 由 子 问题 C 的 
解 递 推 得 到 。 对 于 这 种 情况 , 动态 规划 法 对 子 问题 C 只 求解 一 次 , 然后 将 其 结果 保存 在 一 张 表 中 
( 此 表 也 称 为 备忘录 ), 避免 每 次 遇 到 这 种 情况 都 重复 计算 子 问 题 C 的 解 。 除 此 之 外 , 动态 规划 法 
的 子 问题 还 要 满足 “无 后 向 性 ”要 求 。 

动态 规划 法 不 像 贪 焚 法 或 分 治 法 那样 有 固定 的 算法 实现 模式 , 作为 解决 多 阶段 决策 最 优化 问 
题 的 一 种 思想 , 它 没有 具体 的 实现 模式 ,可 以 用 带 备忘录 的 递归 方法 实现 , 也 可 以 根据 堆 释 子 问 
题 之 间 的 弟 推 公式 用 递 推 的 方法 实现 。 但 是 从 算法 设计 的 角度 分 析 , 使 用 动态 规划 法 一 般 需 要 四 
个 步骤 ,分别 是 定义 最 优 子 问题 、 定 义 状态 、 定 义 决策 和 状态 转换 方程 以 及 确定 边界 条 件 ， 这 四 
个 问题 解决 了 , 算法 也 就 确定 了 。 接 下 来 就 结合 几 个 实例 分 别 介绍 这 四 个 步骤 ， 这 几 个 例子 分 别 
是 《算法 导论 》 一 书 口中 介绍 的 装配 站 问题 、 前 文 提 到 的 背包 问题 以 及 经 典 的 最 长 公共 子 序列 问 
题 (longest common subsequence )。 

1. 定义 最 优 子 问题 

定义 最 优 子 问 题 , 也 就 是 确定 问题 的 优化 目标 以 及 如 何 决 策 最 优 解 , 并 对 决策 过 程 划 分 阶段 。 
所 谓 阶段 ， 可 以 理解 为 一 个 问题 从 开始 到 解决 需要 经 过 的 环节 ,这 些 环节 前 后 关联 。 划 分 阶段 没 
有 固定 的 方法 , 根据 问题 的 结构 ， 可 以 按照 时 间 顺 序 划 分 阶段 ,也 可 以 按照 问题 的 演化 状态 划分 
阶段 。 阶 段 划 分 以 后 ,对 问题 的 求解 就 变 成 对 各 个 阶段 分 别 进行 最 优化 决策 , 问题 的 解 就 变 成 按 
照 阶段 顺序 依次 选择 的 一 个 决策 序列 。 

装配 站 问题 的 阶段 划分 比较 清晰 , 把 工件 从 一 个 装配 站 移 到 下 一 个 装配 站 就 可 以 看 作 是 一 个 
阶段 , 其 子 问题 就 可 以 定义 为 从 一 个 装配 站 转移 到 下 一 个 装配 站 ,直到 最 后 一 个 装配 站 完成 工件 
组 装 。 对 于 背包 问题 ,每 选择 装 一 个 物品 就 可 以 看 作 一 个 阶段 ,其 子 问题 就 可 以 定义 为 每 次 向 包 
中 装 一 个 物品 ,直到 超过 背包 的 最 大 容量 为 止 。 最 长 公共 子 序列 问题 可 以 按照 问题 的 演化 状态 划 
分 阶段 , 这 需要 首先 定义 状态 , 有 了 状态 的 定义 , 只 要 状态 发 生 了 变化 , 就 可 以 认为 是 一 个 阶段 。 

状态 既是 决策 的 对 象 , 也 是 决策 的 结果 ， 对 于 每 个 阶段 来 说 ， 对 起 始 状态 施加 决策 ， 使 得 状 
态 发 生 改变 ， 得 到 决策 的 结果 状态 。 初 始 状 态 经 过 每 一 个 阶段 的 决策 ( 状态 改变 ) 之 后 ， 最 终 得 
到 的 状态 就 是 问题 的 解 。 当 然 , 不 是 所 有 的 决策 序列 施加 于 初始 状态 后 都 可 以 得 到 最 优 解 ， 只 有 
一 个 决策 序列 能 得 到 最 优 解 ,状态 的 定义 是 建立 在 子 问 题 定义 的 基础 上 的 ,因此 状态 必须 满足 “无 
后 向 性 ”要 求 。 必 要 时 ， 可 以 增加 状态 的 维度 ， 引 入 更 多 的 约束 条 件 ， 使 得 状态 定义 满足 “无 后 
向 性 ”要 求 。 

装配 站 问题 的 实质 就 是 在 不 同 的 装配 线 之 间 选 择 装 配 站 , 使 得 工件 装配 完成 的 时 间 最 短 , 其 
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状态 s[iy] 就 可 以 定义 为 通过 第 i 条 装配 线 的 第 j 个 装配 站 所 需要 的 最 短 时 间 。 背 包 问 题 本 身 是 个 
线性 过 程 ， 但 是 如 果 简 单 将 状态 定义 为 装 入 的 物品 编号 ， 也 就 是 定义 s 四 为 装 入 第 i 件 物品 后 获 
得 的 最 大 价值 ， 则 子 问题 无 法 满足 “无 后 向 性 ”要 求 , 原因 是 之 前 的 任何 一 个 决策 都 会 影响 到 所 
有 的 后 序 决策 ( 因为 装 入 物品 后 背包 容量 发 生 了 变化 )， 因 此 需要 增加 一 个 维度 的 约束 。 考 虑 到 
每 装 和 人 一 个 物品 ,背包 的 剩余 容量 就 会 减少 ,故而 选择 将 背包 容量 也 包含 的 状态 定义 中 。 最 终 背 
包 问 题 的 状态 s[ij] 定义 为 将 第 i 件 物 品 装 入 容量 为 j 的 背包 中 所 能 获得 的 最 大 价值 。 对 于 最 长 公 
共 子 序列 问题 , 如 果 定 义 str1[1...i] 为 第 一 个 字符 串 前 i 个 字符 组 成 的 子 串 , 定义 str2[1...j] 为 第 二 
个 字符 串 的 前 j 个 字符 组 成 的 子囊 ， 则 最 长 公共 子 序列 问题 的 状态 s[ij] 定义 为 strl[1...1] 与 
str2[1.. ,的 最 长 公共 子 序列 长 度 。 

3. 定义 决策 和 状态 转换 方程 

定义 决策 和 状态 转换 方程 。 决 策 就 是 能 使 状态 发 生 转 变 的 选择 动作 ， 如 果 选 择 动作 有 多 个 ， 
则 决策 就 是 取 其 中 能 使 得 阶段 结果 最 优 的 那 一 个 ,状态 转换 方程 是 描述 状态 转换 关系 的 一 系列 等 
式 ， 也 就 是 从 n-1 阶段 到 阶段 演化 的 规律 。 状 态 转 换取 决 于 子 问题 的 堆 羞 方式 ， 如 果 状 态 定义 
得 不 合适 ,就 会 导致 子 问题 之 间 没 有 重 芭 ,也 就 不 存在 状态 转换 关系 了 。 没有 状态 转换 关系 ， 动 
态 规划 也 就 没有 意义 了 ， 实 际 算法 就 退化 为 像 分 治 法 那样 的 朴素 递归 搜索 算法 。 

对 于 装配 站 问题 , 其 决策 就 是 选择 在 当前 工作 线 上 的 下 一 个 工作 站 继续 装配 , 或 者 花费 一 定 
的 开销 将 其 转移 到 另 一 条 工作 线 上 的 下 一 个 工作 站 继续 装配 。 如 果 定 义 a[ij] 为 第 i 条 工作 线 的 第 
7 个 装配 站 需要 的 装配 时 间 , Kliy] 为 从 男 一 条 工作 线 转 移 到 第 i 条 装配 线 的 第 j 个 装配 站 需要 的 转 
移 开 销 ， 则 装配 站 问题 的 状态 转换 方程 可 以 描述 为 : 

s[1y] = min(s[1y—1]+a[1, 7], s[2, /~1]+k[1, 7]+al1, 让) 
$s[2y] = min(s[2y—1]+a[2, 7], s[1, /~1]+k[2, +a[2, /]) 

背包 问题 的 决策 很 简单 ， 就 是 判断 装 入 第 i 件 物品 获得 的 收益 最 大 还 是 不 装 和 第 i 件 物品 获 
得 的 收益 最 大 。 如 果 不 装 入 第 i 件 物 品 ， 则 尼 包 内 物品 的 价值 仍然 是 s[i-1, 四 状态 ， 如 果 装 入 第 i 
件 物品 ， 则 背包 内 物品 的 价值 就 变 成 s[i, 广 了 网 + 已 状态， 其 中 志和 Pi 分 别 是 第 i 件 物品 的 容积 和 
价值 ， 决 策 的 状态 转换 方程 就 是 : 

s[ij] = max(s[i—1, 7], s[i, j—Vi+P;) 

最 长 公共 子 序列 问题 的 决策 方式 就 是 判断 str1[ 训 和 str2 思 的 关系 ， 如 果 str1 思 与 str2[ 用 相同 ， 

则 公共 子 序列 的 长 度 应 该 是 s[i-1，j-1]+1， 否 则 就 分 别 尝试 匹配 str1[1… 订 1] 与 str2[1… 少 的 最 长 


公共 子囊， 以 及 str1[1…" 与 str2[1…j-1] 的 最 长 公共 子 品 ， 然 后 取 二 者 中 较 大 的 那个 值 作为 s[ij] 
的 值 。 最 长 公共 子 序列 问题 的 状态 转换 方程 就 是 : 
s[iy] =s[i-1,j-1]+1 ; strl [可 与 stt2[ 用 相同 


s[i] = max(s[i, j 一 1], s[i1, 诈 ) ; str1 思 与 str2[] 不 相同 
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4. 确定 边界 条 件 

对 于 递归 加 备忘录 方式 (记忆 搜索 ) 实现 的 动态 规划 方法 , 边界 条 件 实际 上 就 是 递归 终结 条 
件 , 无 需 额外 的 计算 。 对 于 使 用 递 推 关 系 直接 实现 的 动态 规划 方法 ,需要 确定 状态 转换 方程 的 递 
推 式 的 初始 条 件 或 边界 条 件 ， 和 否则 无 法 开始 递 推 计算 。 

对 于 装配 站 问题 ,初始 条 件 就 是 工件 通过 第 一 个 装配 站 的 时 间 ， 对 于 两 条 装配 线 来 说 ,工件 
通过 第 一 个 装配 站 的 时 间 虽 然 不 相同 , 但 是 都 是 确定 的 值 , 就 是 移入 装配 线 的 开销 加 上 第 一 个 装 
配 站 的 装配 时 间 。 因 此 装配 站 问题 的 边界 条 件 就 是 : 

s[1,1] =K{1,1] + a[1,1] 


s[2,1] = k[2,2] + a[2,2] 
背包 问题 的 边界 条 件 很 简单 ， 就 是 没有 装 入 任何 物品 的 状态 : 
s[0,Vmax]=0 


确定 最 长 公共 子 序列 问题 的 边界 条 件 , 要 从 其 决策 方式 入 手 ， 当 两 个 字符 串 中 的 一 个 长 度 为 
0 的 时 候 ， 其 公共 子 序列 长 度 肯定 是 0， 因 此 其 边界 条 件 就 是 : 


s[ij] =0; i=0 或 二 0 


3.3.2 ”动态 规划 法 的 例子 : 字符 串 的 编辑 距离 

我 们 把 两 个 字符 串 的 相似 度 定义 为 : 将 一 个 字符 串 转 换 成 另外 一 个 字符 串 时 需要 付出 的 代 
价 。 转 换 可 以 采用 插入、 删除 和 替换 三 种 编辑 方式 ， 因 此 转换 的 代价 就 是 对 字符 串 的 编辑 次 数 。 
字符 串 转换 的 方法 不 唯一 ， 以 字符 串 "SNOW" 和 "SUNNY" 为 例 ， 下 面 是 两 种 将 "SNOWY" 转 换 成 "SUNNY" 
的 方法 。 

口 转换 方法 1: 


S-NOWY 
SUNN-Y 


转换 代价 Cost = 3 (插入 U、 替 换 0、 删 除 W) 
口 转换 方法 2: 


-SNOW-Y 
SUN--NY 


转换 代价 Cost = 5 (插入 s、 替 换 Ss、 删除 0、 删 除 W、 插 入 N) 

不 同 的 转换 方法 需要 的 编辑 次 数 也 不 一 样 ， 最 少 的 那个 编辑 次 数 就 是 字符 串 的 编辑 距离 
( edit distance )。 

作为 对 比 ， 首 先 给 出 一 个 朴素 的 递归 算法 ， 递 归 算 法 一 如 既往 地 简单 优雅 : 


int EditDistance(char *src, char *dest) 
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{ 
if((strlen(src) == 0) || (strlen(dest) == 0)) 
return abs(strlen(src) - strlen(dest)); 


if(src[0] == dest[0]) 
return EditDistance(src + 1, dest + 1); 


int edIns = EditDistance(src, dest + 1) + 1; //source 插入 字符 
int edDel = EditDistance(src + 1，dest) + 1; //source 删除 字符 


int edRep = EditDistance(src + 1，dest + 1) + 1; //source 替换 字符 


return min(min(edIns, edDel), edRep); 


} 
显然 ， 朴 素 的 递归 算法 时 间 复 杂 度 是 0(3”)， 对 于 以 上 两 个 长 度 为 5 的 字符 串 ， 递 归 调 用 的 
次 数 是 241 次 ， 接 近 于 3 这 个 量 级 ， 当 字符 串 的 长 度 非常 大 的 时 候 ， 这 个 算法 将 变 得 不 能 接受 。 

现在 考虑 用 动态 规划 的 方法 对 这 个 算法 进行 改进 , 这 个 问题 的 阶段 划分 不 是 很 明显 , 我 们 首 
先 定 义 出 问题 的 状态 ， 从 状态 转换 关系 开始 入 手 定义 阶段 和 子 问 题 的 递 推 关 系 。 假 设 source 字 
符 吕 有 7 个 字符 ，target 字符 串 有 m 个 字符 ， 如 果 将 问题 定义 为 求解 将 source 的 [1…n] 个 字符 转 
换 为 target 的 [1…m] 个 字符 所 需要 的 最 少 编辑 次 数 ( 编辑 距离 )， 则 其 子 问题 就 可 以 定义 为 将 
source 的 前 [1… 可 个 字符 转换 为 target 的 [1…] 个 字符 所 需要 的 最 少 编辑 次 数 , 这 就 是 本 问题 的 最 
优 子 结构 ， 因 此 我 们 将 状态 d[ijj] 定 义 为 从 子 串 source[1… 涪 到 子 串 target[1… 少 之 间 的 编辑 距离 。 

根据 状态 的 定义 ， 两 个 长 度 是 5 的 字符 串 最 多 可 以 有 25 个 状态 ， 朴 素 递 归 方 法 之 所 以 递归 
的 次 数 达 到 了 3” 数量 级 ， 就 是 因为 大 量 的 状态 是 重复 计算 的 ， 没 有 剪 枝 优化 。 现 在 采用 动态 规 
划 的 思想 对 朴素 递归 算法 进行 改造 ， 首 先 引 入 状态 的 概念 ， 递 归 接 口 增加 状态 标志 参数 上 和 j， 
其 次 是 引入 备忘录 概念 , 用 一 个 二 维 表 记录 每 个 状态 的 值 ， 递归 过 程 中 优先 进行 查 表 。 所 有 的 状 
态 记 录 在 一 个 二 维 表 中 ， 二 维 表 的 每 个 元 素 定 义 如 下 : 


typedef struct tagMemoRecord 
{ 


int distance; 
int refCount; 
}MEMO RECORD; 


其 中 distance 是 编辑 距离 ， 初 始 化 为 0xFFFF， 表 示 一 个 无 效 的 状态 。refCount 是 状态 记录 被 引用 
的 次 数 ，0 表示 没有 这 个 状态 的 记录 。 调 整 后 的 算法 如 下 : 


int EditDistance(char *src, char *dest, int i, int j) 


{ 


if(memo[i][j].refCount != 0) // 查 表 ， 直 接 返 回 


memo[i][j].refCount++; 


return memo[i][j].distance; 


int distance = 0; 
if(strlen(src + i) == 0) 


{ 
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distance = strlen(dest + j); 


} 
else if(strlen(dest + j) == 0) 
{ 
distance = strlen(src + i); 
} 
else 
{ 
if(src[i] == dest[j]) 
distance = EditDistance(src, dest, i + 1, j + 1); 
} 
else 
{ 
int edIns = EditDistance(STC，dest，i，j + 1) + 1; // 插 入 字符 
int edDel = EditDistance(src，dest，i+1，j) + 1; // 删 除 字符 
int edRep = EditDistance(src,，dest，i+1，j+1) + 1; // 替 换 字 符 
distance = min(min(edIns, edDel), edRep); 
} 
} 


memo[i][j].distance = distance; 
memo[i][j].refCount = 1; 


return distance; 

} 

仍 以 前 文 提 到 的 两 个 字符 串 为 例 , 采用 动态 规划 的 递归 方案 , 递归 调用 的 次 数 减少 到 40 次 。 
25 个 状态 中 ,有 很 多 状态 被 引用 的 次 数 都 超过 了 2 次, 最 多 的 达到 了 3 次 ,说 明 通 过 查 表 有 效 地 
减少 了 递归 搜索 的 次 数 , 这 就 是 前 文 提 到 的 动态 规划 法 内 在 的 剪 枝 机 制 。 如 果 不 考虑 状态 记忆 表 
的 查询 和 维护 开销 ， 算 法 的 时 间 复 杂 度 已 经 接近 OU 六 的 级 别 。 

现在 已 经 定义 了 状态 , 并且 EditDistance() 函 数 中 也 体现 了 状态 转换 关系 和 状态 的 边界 条 件 ， 
接 下 来 我 们 可 以 直接 给 出 状态 递 推 关 系 方式 的 动态 规划 算法 。 根 据 决策 方式 ，d, 用 的 递 推 关系 
分 为 两 种 情况 , 分 别 是 source[] 等 于 targetJ] 和 source[ 相 不 等 于 target[]， 两 种 情况 下 d[i, 有 四 的 弟 推 
关系 如 下 : 

d[ij] = d[i— 1; — 1] +0; source[] 等 于 target[j] 

d[ij] = min(d[ijy — 1]+1, d[i- 1yj]+1, d[i- 1;-1]+1) ;source[] 不 等 于 target[j] 

当 target 字符 串 是 空 字符 串 时 , 编辑 距离 相当 于 将 source 字符 串 中 的 字符 逐个 删除 的 次 数 ， 
因此 可 以 确定 一 个 边界 条 件 为 : 

d[i,0] = source 字符 串 的 长 度 

同样 ， 如 果 source 字符 串 的 长 度 为 0， 编辑 距离 相当 于 在 source 字符 串 中 逐个 搬入 target 
字符 的 次 数 ， 因 此 另 一 个 边界 条 件 就 是 : 

d[0 媳 = target 字符 串 的 长 度 
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确定 了 递 推 关系 和 边界 条 件 ， 就 可 以 给 出 直接 利用 状态 递 推 关系 实现 的 动态 规划 算法 : 


int EditDistance(char *src, char *dest) 


ji: 工本 
int d[MAX STRING LEN][MAX STRING LEN] = { OxFFFF }; 
for(i = 0; i <= strlen(src); i++) 
d[i][0] = ii 
for(j = 0; j <= strlen(dest); j++) 
d[o][j] = j; 
for(i = 1; i <= strlen(src); i++) 
{ 
for(j = 1; j <= strlen(dest); j++) 
if((src[i - 1] == dest[j - 1])) 
{ 
d[i][j] = d[i - 1][j - 1]; // 不 需要 编辑 操作 
} 
else 
{ 
int edIns = d[i][j - 1] + 1; //source 插入 字符 
int edDel = d[i - 1][j] + 1; //source 删除 字符 
int edRep = d[i - 1][j - 1] + 1; //source 蔡 换 字符 
d[i][j] = min(min(edIns, edDel), edRep); 
} 
} 


return d[strlen(src)][strlen(dest)]; 
} 


以 上 是 一 个 动态 规划 法 应 用 的 实例 , 从 朴素 的 递归 方式 开始 , 通过 明确 状态 定义 ,逐步 过 渡 
到 动态 规划 法 实现 , 帮助 大 家 体会 动态 规划 的 设计 思想 。 虽然 动态 规划 的 概念 很 抽象 , 但 是 只 要 
确定 了 问题 的 实质 ， 按 照 3.3.1 节 给 出 的 四 个 步 又 逐步 分 析 ， 实 现 动 态 规划 法 的 算法 也 不 是 一 件 
很 困难 的 事情 。 有 了 时候 ,如 果 直 接 用 递 推 方式 很 难 写 出 的 算法 实现 , 不 妨 考虑 采用 带 备忘录 的 递 
归 方 式 ， 谁 说 这 不 是 动态 规划 ? 


3.4 解 空间 的 穷 举 搜 索 


不 要 误会 ， 本 节 要 介绍 的 就 是 穷 举 法 ( 穷 举 搜索 法 )。 解 空间 又 称 为 状态 空间 ， 是 所 有 可 能 
是 解 的 候选 解 的 集合 ,之 所 以 特别 强调 在 解 空间 内 穷 举 搜索 ,是 想 传达 一 个 重要 的 思想 , 那 就 是 
穷 举 并 不 是 漫 无 目的 地 乱 找 , 它 是 一 种 在 有 限 的 解 空 间 (〈 解 空间 至 少 在 理论 上 是 有 限 的 ) 内 按照 
一 定 的 策略 进行 查找 的 思想 。 数 学 上 也 把 穷 举 法 称 为 枚 举 法 ,就 是 在 一 个 由 有 限 个 元 素 构成 的 集 
合 中 , 将 所 有 元 素 一 一 枚 举 研 究 的 方法 。 比 如 要 找 出 一 个 班 上 身高 最 高 的 同学 ， 只 需要 给 这 个 班 
上 的 同学 一 一 测量 身高 , 然后 通过 比较 就 可 以 确定 哪个 同学 身高 最 高 。 穷 举 法 就 是 这 样 一 种 思想 ， 


3.4 解 空间 的 穷 举 搜 索 号 41 


对 解 空 间 内 的 候选 解 按 某 种 顺序 进行 逐一 枚 举 和 检验 , 并 根据 问题 给 定 的 条 件 从 中 找 出 那些 符合 
要 求 的 候选 解 作为 问题 的 解 。 穷 举 法 一 般 可 以 找 出 解 空间 中 所 有 正确 的 解 , 如 果 给 定 最 优 解 的 判 
断 条 件 ， 穷 举 法 也 可 以 用 于 求解 最 优 解 问题 。 

一 般 来 说 ， 只 要 一 个 问题 有 其 他 更 好 的 解决 方法 ,通常 不 会 选择 穷 举 法 ， 穷 举 法 也 常 被 作为 
“不 是 办 法 的 办 法 ”或 “最 后 的 办 法 ”。 但 是 绝对 不 能 因为 这 样 而 轻视 穷 举 法 ， 穷 举 法 在 算法 设计 
模式 中 占有 非常 重要 的 地 位 , 它 还 是 很 多 问题 的 唯一 解决 方法 。 穷 举 法 虽然 思想 简单 ,但 是 设计 
解决 特定 问题 的 穷 举 法 实现 却 并 不 简单 。 首 先 ， 解 空间 或 状态 空间 的 定义 没有 具体 的 模式 ， 
不 同 问题 的 解 空间 形式 上 差异 巨大 。 其 次 ,针对 不 同 问题 都 要 选择 不 同 的 搜索 算法 ， 有 很 多 问题 
的 搜索 算法 并 不 直观 ， 需 要 对 问题 做 细致 的 分 析 才 能 得 到 。 正 因为 如 此 ， 穷 举 法 也 被 公认 为 是 最 
“ 难 用 ”的 算法 模式 ， 看 起 来 简单 ， 但 是 面 对 问 题 往往 无 从 下 手 。 但 是 如 果 能 用 好 穷 举 法 ， 你 就 
掌握 了 能 解决 所 有 问题 的 “通用 算法 ”， 至 少 理论 上 是 这 样 。 

穷 举 法 的 基本 思想 就 是 以 下 两 个 步骤。 

(1) 确定 问题 的 解 〈 或 状态 ) 的 定义 ， 解 空间 的 范围 以 及 正确 解 的 判定 条 件 。 

(2) 根据 解 空间 的 特点 选择 搜索 策略 ， 一 一 检验 解 空间 中 的 候选 解 是 否 正确 ， 必 要 时 可 辅助 
一 些 剪 枝 算法 ， 排 除 一 些 明显 不 可 能 是 正确 解 的 检验 过 程 ， 提 高 穷 举 的 效率 。 

正如 前 面 所 讲 的 那样 , 穷 举 法 的 设计 思想 非常 简单 ,没有 任何 条 件 性 的 约束 和 假设 , 使 得 穷 
举 法 几乎 适合 求解 任何 问题 ， 当 然 ， 穷 举 法 的 “ 难 用 ”也 体现 在 这 两 个 步骤 上 。 


> 
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3.4.1 解 空间 的 定义 

解 空间 就 是 全 部 可 能 的 候选 解 的 一 个 约束 范围 , 确定 问题 的 解 就 在 这 个 范围 内 , 将 搜索 策略 
应 用 到 这 个 约束 范围 就 可 以 找到 问题 的 解 。 用 “空间 ”这 个 词 是 为 了 说 明 候 选 解 不 一 定 是 线性 结 
构 , 根据 问题 的 类 型 , 解 空间 的 结构 可 能 是 线性 表 、 集 合 、 树 或 者 图 。 有 时 候 ， 这 个 空间 内 的 对 
象 不 是 问题 的 解 ， 而 是 一 些 被 称 为 状态 的 对 象 , 通过 对 状态 的 计算 和 人 处理 ,可 以 间接 地 得 到 问题 
的 解 ， 这 样 的 搜索 空间 也 常 被 理解 为 状态 空间 。 

要 确定 解 空间 ， 首先 要 定义 问题 的 解 ， 建 立 解 的 数学 模型 。 如 果 解 的 数学 模型 选择 错误 或 不 
合适 ， 会 导致 解 空间 结构 繁杂 ， 范 围 难 以 界定 ， 甚 至 无 法 设计 搜索 算法 。 以 3.1.2 节 给 出 的 0-1 
背包 问题 为 例 , 如 果 将 物品 的 最 大 价值 定 为 解 的 数学 模型 , 则 解 空 间 内 的 候选 解 就 是 某 几 件 物品 
的 价值 总 和 ， 解 空间 的 范围 就 是 [0, 235]，235 是 全 部 7 件 物品 的 价值 总 和 。 如 果 对 这 个 解 空间 穷 
举 搜索 ,就 需要 根据 每 一 个 价值 总 和 反 推 出 这 个 价值 总 和 由 哪 几 个 物品 组 成 , 这 会 使 搜索 算法 非 
常 麻烦 。 如 果 换 一 个 角度 考虑 这 个 问题 ， 将 解 的 数学 模型 定义 为 物品 的 选择 状态 ,用 一 个 7 元 组 
分 别 表 示 7 件 物品 的 选择 状态 ，0 表示 不 选择 装 入 该 物品 ，1 表示 选择 装 入 该 物品 。 根 据 之 前 解 
题 的 答案 ， 最 优 解 是 选择 1、2、4、6、7 号 物品 ， 用 7 元 组 表示 就 是 [1,1,0,1,0,1,1]。 根 据 这 个 选 
择 状 态 , 计算 最 终 的 物品 总 价值 的 方法 非常 简单 ， 直 接 求 和 即 可 ， 比 前 一 种 方案 的 根据 价值 总 和 
反 推 物品 选择 状态 也 简单 很 多 。 根 据 状 态 定义 ， 解 空间 一 共有 128 ( 2  ) 个 状态 ， 非 法 解 判断 与 
合法 解 的 判断 ， 以 及 最 优 解 的 比较 算法 都 非常 简单 。 最 重要 的 是 ， 搜 索 算法 的 设计 也 很 简单 ，n 
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元 组 的 遍历 有 递归 、 多 重 循环 等 多 种 成 熟 的 实现 方法 可 以 选择 ， 简 单 套用 即 可 。 

上 例 中 的 解 空 间 是 一 种 相对 简单 的 定义 ,候选 解 或 状态 之 间 相 互 独立 , 没有 关联 关系 ， 可 以 
用 线性 表 , 也 可 以 用 集合 来 组 织 解 空间 。 在 很 多 情况 下 ， 候选 解 或 状态 之 间 不 独立 ,存在 各 种 关 
联 关系 , 第 6 章 介 绍 的 “妖怪 与 和 尚 过 河 问 题 ”就 是 一 个 这 样 的 例子 。 妖 怪 与 和 尚 用 一 个 6 元 组 
定义 状态 ,0 表示 在 河 左 岸 ,1 表示 在 河 右 岸 ,初始 状态 是 [0,0,0,0,0,0], 最 终 解 的 状态 是 [1,1,1,1,1,1]。 
这 些 状态 之 间 没 有 简单 的 规律 , 不 能 用 一 套 通用 的 遍历 算法 将 这 些 状态 都 事先 确定 好 , 但 是 可 以 
根据 状态 之 间 的 演化 关系 ， 从 一 种 状态 推出 另 一 种 或 几 种 状态 ,递归 地 执行 这 种 状态 演化 ,逐步 
得 到 整个 状态 空间 。 在 这 种 情况 下 ， 解 空间 通常 伴随 着 搜索 算法 展开 ， 从 一 个 原始 状态 开始 , 逐 
步 扩展 至 整个 解 空间 。 这 样 的 解 空间 通常 被 组 织 成 一 棵 状态 树 , 最 终 状态 就 是 状态 树 的 叶子 节点 ， 
从 根 节点 到 叶子 节点 之 间 的 状态 转换 过 程 就 是 问题 求解 的 过 程 。 对 于 更 复杂 的 情况 , 需要 用 图 的 
一 些 方 法 组 织 和 搜索 解 空 间 ， 在 这 种 情况 下 ， 解 空间 就 是 节点 和 边 的 关系 空间 。 


3.4.2 ” 穷 举 解 空 间 的 策略 


穷 举 解 空间 的 策略 就 是 搜索 算法 的 设计 策略 ， 简 单 的 问题 可 以 用 通用 的 搜索 算法 ， 比 如 0-1 
背包 问题 的 解 空 间 可 以 用 排列 组 合算 法 得 到 , 复杂 的 问题 需要 根据 实际 情况 设计 搜索 算法 。 根 据 
问题 的 需要 设计 搜索 算法 是 一 件 困难 重重 的 事情 , 没有 捷径 , 只 能 在 常用 搜索 策略 的 基础 上 多 实 
践 , 多 积累 。 盲目 搜索 和 启发 性 搜索 是 两 种 最 常用 的 搜索 策略 。 顾 名 思 义 ,盲目 搜索 就 是 不 带 任 
何 假设 的 穷 举 搜索 ,不管 行 不 行 ， 眉毛 胡子 一 把 抓 。 启 发 性 搜索 是 利用 某 种 策略 或 计算 依据 ， 有 
目的 地 搜索 ,这 些 策略 和 依据 通常 能 够 加 快 算法 的 收敛 速度 , 或 者 能 够 划 定 一 个 更 小 的 、 最 有 可 
能 出 现 解 的 空间 并 在 此 空间 上 搜索 。 

一 般 来 说 , 为 了 加 快 算法 的 求解 ,通常 会 在 搜索 算法 的 执行 过 程 中 伴随 一 些 剪 校 动作 。 剪 校 
是 一 个 很 形象 的 比喻 ,如 果 某 一 个 状态 节点 确定 不 可 能 演化 出 结果 , 就 应 该 停止 从 这 个 状态 节点 
开始 的 搜索 , 相当 于 状态 树 上 这 一 分 校 就 被 剪 掉 了 。 除 了 采用 剪 校 策 略 , 还 可 以 使 用 限制 搜索 深 
度 的 方法 加 快 算法 的 收敛 , 但 是 限制 搜索 深度 会 导致 无 解 ,或 错过 最 优 解 , 通常 只 在 特定 的 情况 
下 使 用 ， 比 如 博弈 树 的 搜索 。 

1. 盲目 搜索 算法 

广度 优先 搜索 和 深度 优先 搜索 是 两 种 常用 的 盲目 搜索 算法 ， 这 种 搜索 算法 只 根据 问题 的 规 
模 , 按照 广度 优先 和 深度 优先 的 原则 搜索 解 空间 内 的 每 一 个 状态 。 广度 优 先 和 深度 优先 的 算法 模 
式 已 经 在 第 2 章 介绍 过 , 这 里 不 再 袭 述 。 广 度 优先 算法 因为 需要 额外 的 存储 空间 ， 因 此 在 设计 算 
法 时 要 考虑 此 额外 空间 的 规模 。 深度 优先 算法 在 搜索 过 程 中 容易 陷入 状态 循环 ,导致 在 一 个 没有 
解 的 子 树 上 “ 死 循环 "， 一 般 需 要 做 状态 循环 的 判断 和 避免 。 但 总 的 来 说 ， 两 种 策略 并 无 优 劣 之 
分 ， 很 多 情况 下 可 以 互 换 使 用 。 

2. 启发 式 搜索 算法 

很 多 情况 下 ， 当 问题 的 规模 达到 一 定 的 程度 ,盲目 搜索 算法 就 会 因为 低 效 而 被 排斥 ,理论 上 
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可 以 得 到 答案 , 但 是 要 等 一 万 年 ， 这 是 人 类 不 能 接受 的 结果 。 如 果 搜 索 能 够 智能 化 一 点 ,利用 搜 
索 过 程 中 出 现 的 额外 信息 直接 跳 过 一 些 状态 ,避免 讶 目的 、 机 械 式 的 搜索 ,就 可 以 加 快 搜索 算法 
的 收敛 , 这 就 是 启发 性 搜索 。 启 发 性 搜索 需要 一 些 额外 信息 和 操作 来 “启发 ”搜索 算法 ,根据 这 
此 信息 的 不 同 ， 启 发 方式 也 不 同 。 如 果 知 道 解 空间 的 状态 分 布 呈 现 正 态 分 布 的 特征 ， 如 图 3-1 所 
示 , 则 可 以 从 分 布 中 间 值 开始 向 两 边 搜索 ,因为 在 中 间 值 附近 出 现 最 优 解 的 概率 更 高 ， 这 就 是 启 
发 式 搜索 。 如 果 能 有 一 个 状态 评估 函数 ， 可 以 对 每 个 状 。 

态 节点 能 演化 出 解 的 可 能 性 进行 评 佑 ， 搜 索 过 程 中 根据 ”外 


这 种 可 能 性 对 待 搜索 的 状态 节点 排序 ， 也 是 一 种 启发 式 | 
搜索 。 再 简单 一 点 ， 如 果 在 某 一 个 层面 的 搜索 能 应 用 贪 ' 


禁 策 略 ， 优 先 选 择 与 贪 禁 策 略 符合 的 状态 节点 进行 搜索 ， 
也 是 一 种 启发 式 搜索 。 第 21 章 介绍 的 A* 寻 径 算法 ,也 是 | -一 | | 


一 种 带 启发 的 搜索 算法 ， 利 用 路 径 评估 函数 ， 每 次 都 选 0 
择 距 离 出 发 点 最 近 的 位 置 开始 搜索 。 图 3-1 正 态 分 布 示意 图 
3. 前 枝 策略 


对 解 空 间 穷 举 搜索 时 , 如 果 有 一 些 状态 节点 可 以 根据 问题 提供 的 信息 明确 地 被 判定 为 不 可 能 
演化 出 最 优 解 ， 也 就 是 说 ， 从 此 节点 开始 遍历 得 到 的 子 树 ， 可 能 存在 正确 的 解 , 但 是 肯定 不 是 最 
优 解 ， 就 可 以 跳 过 此 状态 节点 的 遍历 ,这 将 极 大 地 提高 算法 的 执行 效率 。 这 就 是 剪 枝 策略 。 应 用 


都 附着 在 特定 的 搜索 算法 中 ， 比 如 博弈 树 算法 中 常用 的 极 大 极 小 值 算法 和 “aw-B” 算 法， 都 伴随 
着 相应 的 前 校 算法 。 除 了 针对 特定 问题 类 型 的 剪 校 算法 之 外 ,没有 可 以 一 统 天 下 的 通用 评价 方法 ， 
通常 需要 根据 实际 问题 小 心地 分 析 ， 确 定 评价 方法 。 

除了 最 优 解 问题 , 还 有 一 种 情况 也 会 用 到 剪 校 策略 。 对 解 空间 内 的 状态 节点 遍历 搜索 的 过 程 
中 ,会 有 一 些 在 特定 搜索 策略 下 重复 出 现 的 状态 节点 , 对 这 些 状态 节点 如 果 不 做 特殊 处 理 , 不 仅 
会 因为 重复 处 理 相同 的 状态 节点 而 降低 效率 ,还 可 能 会 导致 深度 优先 搜索 算法 “陷入 ”到 某 个 子 
树 的 搜索 中 无 法 退出 。 举 个 例子 ， 如 果 出 现 对 状态 A 搜索 得 到 子 状态 B， 对 状态 B 搜索 得 到 子 
状态 C， 对 状态 C 搜 索 又 可 得 到 子 状态 A 的 情况 ， 就 会 使 得 搜索 算法 陷入 “ 死 循环 ”"。 在 这 种 情 
况 下 , 常用 的 剪 枝 策略 就 是 找到 一 种 算法 对 状态 计算 校 验 值 , 通过 比较 校 验 值 判 断 是 否 是 已 经 处 
理 过 的 状态 节点 。 第 22 章 介绍 华容 道 游 戏 的 自动 求解 算法 时 ， 就 用 到 了 这 种 剪 枝 策 略 。 

4. 搜索 算法 的 评估 和 收敛 

穷 举 法 虽然 被 称 为 灵活 的 “通用 算法 ”, 但 也 不 是 万 能 的 , 穷 举 法 最 大 的 敌人 是 问题 的 规模 。 
很 多 问题 ， 当 规模 大 到 一 定 程度 时 , 使 用 穷 举 法 就 只 具有 理论 上 的 可 行 性 。 对 某 些 问 题 , 穷 举 法 
是 最 后 的 办 法 , 但 是 问题 规模 又 大 到 无 法 对 解 空 间 进行 完整 的 搜索 , 这 时 候 就 需要 对 搜索 算法 进 
行 评 估 ， 并 确定 一 些 收敛 原则 。 收 敛 原则 就 是 只 要 能 找到 一 个 比较 好 的 解 就 返回 〈 不 求 最 好 )， 
根据 解 的 评估 判断 是 否 需要 继续 下 一 次 搜索 。 大 型 棋 类 游戏 通常 面临 这 种 问题 ， 比 如 国际 象棋 和 
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围棋 的 求解 算法 , 想 要 搜索 整个 解 空间 得 到 最 优 解 目前 是 不 可 能 的 , 所 以 此 类 搜索 算法 通常 都 通 
过 一 个 搜索 深度 参数 来 控制 搜索 算法 的 收敛 ， 当 搜索 到 指定 的 深度 时 ( 相当 于 走 了 若干 步 棋 ) 就 
返回 当前 已 经 找到 的 最 好 的 结果 ， 这 种 退 而 求 其 次 的 策略 也 是 不 得 已 而 为 之 , 第 23 章 介 绍 博弈 
树 和 棋 类 游戏 的 时 候 ， 会 具体 介绍 相关 的 方法 。 


3.4.3 “” 穷 举 搜索 的 例子 : Google 方程 式 


有 一 个 由 字符 组 成 的 等 式 : WWWDOT - GOOGLE = DOTCOM， 每 个 字符 代表 一 个 0~ 9 之 
间 的 数字 , WWWDOT、GOOGLE 和 DOTCOM 都 是 合法 的 数字 ,不 能 以 0 开头 。 请 找 出 一 组 字 
符 和 数字 的 对 应 关系 ， 使 它们 互相 殖 换 ， 并 量 蔡 换 后 的 数字 能 够 满足 等 式 。 据 说 这 是 Google 公 
司 的 面试 题 ， 我 没有 考证 过 ， 不 过 这 种 字符 方程 (或 字符 等 式 ) 问题 有 很 多 变种 ， 比 如 2005 年 
的 Google 中 国 编程 挑战 赛 第 二 轮 淘汰 赛 有 一 道 名 为 “SecretSum” 的 500 分 的 竞赛 题 ， 与 本 题 如 
出 一 略 ， 只 不 过 字母 是 3 个 ， 而 且 用 的 是 加 法 计算 。 这 个 问题 其 实 并 不 难 ， 你 可 以 将 其 列 成 竖 式 
减法 的 形态 ， 然 后 人 工 推算 出 来 ， 不 过 接 下 来 我 们 要 使 用 穷 举 法 来 求解 这 个 问题 。 

从 穷 举 法 的 角度 看 ,这 是 一 个 典型 的 排列 组 合 问题 , 题目 中 一 种 出 现 了 9 个 字母 , 每 个 字母 
都 可 能 是 0 ~9 之 间 的 数字 ， 穷 举 的 方法 就 是 对 每 个 字母 用 0 ~ 9 的 数字 尝试 10 次 ， 如 果 某 一 次 
得 到 的 字母 和 数字 的 对 应 关系 能 够 满足 减法 等 式 ， 则 输出 这 一 组 对 应 关系 。 根 据 题 目 意思 ,每 个 
字母 代表 一 个 数字 ， 也 就 是 说 ， 如 果 W 代表 1， 则 其 他 8 个 字母 就 不 可 能 是 1。 很 显然 ， 这 是 个 
组 合 问题 ， 如 果 不 考 虑 0 开头 数字 的 情况 ， 这 样 的 组 合 应 该 有 10x9x8x7x6x5x4x3x 
2=3628800 种 组 合 ， 在 这 样 的 数量 级 上 使 用 穷 举 法 ， 计 算 机 处 理 起 来 应 该 没有 压力 。 

现在 考虑 给 出 一 种 解决 这 种 字符 方程 问题 的 通用 解法 。 从 数据 结构 定义 上 , 首先 要 避免 使 用 
固定 9 个 字符 的 方法 ， 这 就 需要 定义 一 个 可 变化 的 字符 元 素 列 表 ， 每 个 字符 元 素 包 含 3 个 属性 ， 
分 别 是 字母 本 身 、 字 母 代表 的 数字 以 及 是 否 是 数字 的 最 高 位 ( 根据 题 意 ， 最 高 位 不 能 是 0， 所 以 
要 特别 对 待 ): 

typedef struct tagCharItem 


char c; 

int value; 

bool leading; 
}CHAR_ITEM; 


对 于 本 题 ， 这 个 列表 可 以 初始 化 为 : 


CHAR ITEM charItem[] = { { 'W', -1, true }, { 'D', -1, true }, { '0', -1, false }, 
{ 'T', -1, false }, { 'G', -1, true }, { 'L', -1, false }, 
{ 'E', -1, false }, { 'C', -1, false }, { 'M', -1, false } }; 


如 果 换 成 Google 编程 挑战 赛 的 “SecretSum” 题 目 ， 这 个 列表 可 以 初始 化 为 : 


CHAR_ITEM charItem[] = { {'A', -1, true}, {'B', -1, true}, {'C', -1, true}, 
{'D', -1, false} }; 
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因为 这 是 一 个 组 合 问题 , 两 个 字母 不 能 被 指定 为 相同 的 数字 , 这 就 需要 对 每 个 数字 做 一 个 标 
识 ， 当 这 个 数字 已 经 被 某 个 字符 “占用 ”时 ， 其 他 字符 不 能 再 使 用 这 个 数字 。 我 们 对 可 参与 穷 举 
的 数字 也 定义 一 个 列表 ， 对 于 这 个 问题 来 说 ，0 ~9 都 可 以 参与 穷 举 ， 但 是 有 的 问题 可 能 有 特殊 
的 约束 ， 比 如 字符 只 能 代表 偶数 ， 或 只 能 代表 奇数 等 ， 每 个 数字 元 素 有 一 个 额外 的 占用 标识 : 


typedef struct tagCharValue 


bool used; 
int value; 
}CHAR VALUE; 


穷 举 的 搜索 算法 采用 递归 的 方式 进行 组 合 枚 举 , 按照 charTten 列表 中 的 顺序 , 逐个 对 每 个 字 
符 进行 数字 遍历 ， 算 法 实现 如 下 : 


void SearchingResult(CHAR ITEM ci[], CHAR VALUE cv[]， 
int index，CharListReadyFuncPtr callback) 


if(index == max_char count) 


callback(ci); 
return; 
} 
for(int i = 0; i < max number count; ++i) 
{ 
if(IsValueValid(ci[index], cv[i])) 
cv[il].used = true;/*set used sign*/ 
ci[index].value = cv[i].value; 
SearchingResult(ci, cv, index + 1, callback); 
cv[il].used = false;/*clear used sign*/ 
} 
} 


} 

根据 题目 要 求 W、G 和 DD 这 3 个 字符 不 能 是 0， 因 此 枚 举 过 程 中 对 这 3 个 字符 是 0 的 情况 
进行 剪 校 ，Isvaluevalid() 函数 就 是 评估 函数 ,通过 剪 枝 操 作 ，callback 被 调用 的 次 数 由 理论 上 的 
3628800 次 减少 为 2540160, 减少 了 约 30% 的 计算 判断 。index 参数 标识 字符 索引 ,每 次 递归 调用 
对 索引 为 index 的 字符 进行 数字 遍历 ， 当 index 等 于 字符 个 数 时 ， 表 示 所 有 的 字符 都 已 经 指定 了 
对 应 的 数字 ， 可 以 调用 callback 进行 结果 判断 。SearchingResult() 函 数 可 以 作为 此 类 问题 的 通用 
搜索 框架 ， 只 需 指定 不 同 的 CHAR_ITEM 和 CHAR_VALUE 参数 ， 以 及 结果 处理 回调 callback 即 可 。 对 
于 本 题 ，callback 函数 可 以 这 样 编写 : 


void OnCharListReady(CHAR_ITEM ci[]) 


char *minuend = "WWWDOT™; 
char *subtrahend = "GOOGLE"; 
char *diff = "DOTCOM"; 


int m = MakeIntegerValue(ci, minuend); 
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int s = MakeIntegerValue(ci, subtrahend); 
int d = MakeIntegerValue(ci, diff); 
if((m - s) -= d) 


std:i:cout <«< mx<x<"- "< sx = dstd::endl; 


} 
对 整个 解 空 间 搜索 以 后 ， 只 得 到 以 下 两 个 合法 的 答案 : 


777589 - 188103 = 589486 
777589 - 188106 = 589483 


3.5 总结 


本 章 介绍 了 几 种 设计 算法 常用 的 思想 ,这些 方法 之 间 既 有 相同 点 ， 也 有 差别 。 模 式 作为 算法 


演进 的 一 些 固 定 的 思路 , 提供 了 一 些 构造 算法 的 常用 思想 , 但 不 是 构造 算法 的 全 部 方法 , 不 可 以 
将 其 作为 特定 的 框架 套用 , 而 应 该 具体 问题 具体 分 析 , 在 了 解 各 种 算法 思想 的 原理 和 适用 原则 的 
基础 上 , 灵活 地 运用 这 些 算 法 设计 思想 。 本 书 随后 章节 给 出 的 各 种 趣味 算法 以 及 这 些 算 法 在 现实 
中 的 应 用 ， 处 处 都 可 见 这 些 算 法 设计 思想 的 影子 。 
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第 子 章 
阿拉 伯 数 字 与 中 文 数字 


在 人 类 文明 的 进化 过 程 中 ,数字 很 可 能 早 于 文字 出 现 。 不 同 民族 的 计数 方法 也 是 千奇百怪 的 ， 
例如 , 在 英语 中 表示 数字 的 单词 是 digit， 而 在 其 祖先 拉丁 语 中 ，digitus 表示 手指 ，digitos 表示 脚 
趾 , 根据 它们 共有 的 词根 digit, 不 难 猜 想 他 们 最 初 的 计数 工具 是 什么 。 也 有 一 些 民族 采用 小 石子 
或 通过 在 绳子 上 打 结 来 计数 ， 据 说 非洲 有 些 部 落 用 鳄鱼 计数 ,可见 部 落 民风 之 彪 悍 。 据 说 ， 因 纽 
特 人 不 擅长 计数 ， 他 们 曾 与 世 隔绝 生存 了 4000 多 年 ， 因 此 让 因 纽 特 人 从 1 数 到 6 都 需要 相当 大 
的 勇气 。 最 早 到 来 的 白人 殖民 者 居然 让 因 纽 特 人 每 天 统计 狩猎 情况 ,结果 导致 了 因 纽 特 人 的 暴动 。 
看 来 数 数 还 是 个 性 命 依 关 的 大 事 ， 这 些 白 人 殖民 者 不 仅 缺 德 ， 还 缺 心眼 儿 。 

掌握 计数 方法 是 人 类 文明 的 基本 要 素 之 一 , 很 多 古代 文明 都 有 自己 的 数字 体系 ， 比 如 古 埃 及 
和 印度 使 用 的 十 进 制 数字 、 玛 雅 人 使 用 的 二 十 进 制 数字 ,等 等 。 中 文 数字 记 数 方式 以 及 记 账 的 大 
写 数 字 是 中 国 特有 的 数字 体系 ,用 方块 字 描 述 数字 , 用 符合 中 文 语法 的 方式 书写 、 记 录 数 字 , 具 
有 鲜明 的 中 国 特色 。 中 文 数字 的 计数 方式 与 全 球 通 用 的 阿拉 伯 数 字体 系 的 计数 方式 过 然 不 同 , 两 
种 计数 方式 之 间 的 转换 就 成 为 一 个 很 有 意思 的 话题 。 这 个 主题 也 很 适合 作为 程序 员 招 聘 的 面试 
题 , 网 上 有 很 多 类 似 的 转换 算法 ,但 是 大 部 分 都 有 问题 。 本 章 将 介绍 中 文 数 字 与 阿拉 伯 数 字 相 互 
转换 的 算法 ,并 给 出 一 个 中 文 数字 转换 的 测试 用 例 ,该 用 例 符合 国家 对 中 文 数字 使 用 的 相关 标准 ， 
也 符合 本 章 最 后 给 出 的 两 个 行业 标准 的 规定 。 经 过 测试 , 网 上 能 找到 的 公开 的 算法 基本 上 都 不 满 
足 该 测试 用 例 。 


4.1 中 文 数字 的 特点 

中 文 数字 也 采用 十 进 制 , 用 汉字 “者 一 二 三 四 五 六 七 八 九 ”表示 基本 记 数 ,与 阿拉 伯 数 字 靠 数 
字 偏 移 位 置 暗示 数字 的 权 位 不 一 样 ， 中 文 数字 直接 用 “数字 + 权 位 ”的 方式 组 成 数字 ， 比 如 阿拉 伯 
数字 100, 用 中 文 计数 就 是 “一 百 ”, 其 中 “一 ”是 数字 ,“ 百 ”是 数字 的 权 位 。 中 文 常用 的 数字 权 
位 有 “十 ”“ 百 ”“ 千 ”“ 万 ”“ 亿 ”等 ， 这 些 权 位 对 应 的 阿拉 伯 数 字 记 数 单位 ( 偏 移 位 置 ) 如 下 : 

十 10 

百 100 
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千 ”1000 
万 ”10000 
亿 100000000 


除了 以 上 几 种 权 位 ， 中 国 古 代 还 有 兆 、 京 、 坊 等 表示 更 大 尺度 的 数字 权 位 ,但 是 关于 这 些 数 
字 权 位 的 定义 却 各 不 相同 ， 有 的 计数 方式 是 万 万 为 亿 , 亿 亿 为 兆 , 兆 兆 为 京 , 还 有 的 计数 方式 是 
万 万 为 亿 、 万 亿 为 兆 、 万 兆 为 京 。 现 代 科 学 技术 中 常 说 的 “ 兆 ” 已 经 被 定义 为 一 百 万 ， 因 此 现代 
中 文 计数 不 再 使 用 “ 兆 ” 和 比 “ 兆 ”更 大 的 单位 , 而 是 用 “万 亿 ”、“ 百 万 亿 ”、“ 千 万 亿 ”、“ 亿 亿 ” 
来 堆 芭 计数。 


4.1.1 中文 数 字 的 权 位 和 小 节 


中 文 数字 的 特点 之 一 就 是 每 个 计数 数字 都 跟着 一 个 权 位 , 这 个 权 位 就 是 这 个 数字 的 量 值 , 相 
当 于 阿拉 伯 数 字 中 的 数位 。 比 如 中 文 数字 “一 千 二 百 三 十 ”， 数字 “一 ”的 权 位 是 “ 千 ”， 对 应 的 
阿拉 伯 数 字 的 值 是 1x1000， 数 字 “ 二 ”的 权 位 是 “ 百 ”， 对 应 的 阿拉 伯 数 字 的 值 是 2x100， 数 字 
“三 ”的 权 位 是 “十 ”， 对 应 的 阿拉 伯 数 字 的 值 是 3x10， 整个 数字 的 值 就 是 1x1000+ 2x100+3x10 
= 1230。 最 低位 数字 没有 权 位 ， 也 可 以 理解 为 权 位 是 空 。 

中 文 计数 的 另 一 个 特点 是 以 “万 ”为 小 节 ( 欧美 的 计数 习惯 是 以 “ 千 ” 为 小 节 )， 每 一 个 小 
节 都 有 一 个 节 权 位 ， 万 以 下 的 节 没 有 节 权 位 (或 节 权 位 是 空 )， 万 以 上 的 节 权 位 就 是 万 ， 再 大 就 
是 亿 ( 即 万 的 一 万 倍 )。 每 个 小 节 内 部 以 “十 百 千 ”为 权 位 独立 计数 。“ 十 百 千 ”这 几 个 权 位 是 不 
能 连续 出 现 的 ， 比 如 “二 十 百 ” 和 “一 千 千 ” 都 是 非法 的 中 文 数字 , 但 是 “万 ”和 “ 亿 ” 作 为 节 
权 位 时 可 以 和 其 他 权 位 连 在 一 起 使 用 ， 比 如 “二 十 亿 ” 和 “五 千 万 ”都 是 合法 的 中 文 数字 。 


4.1.2 ”中 文 数字 的 零 


中 文 计数 还 有 一 个 特点 , 就 是 “ 零 ” 的 使 用 变化 多 端 。 阿拉伯 数字 中 数字 的 权 位 依靠 数字 在 
整个 数字 长 度 中 的 偏 移 位 置 确定 ,因此 数字 中 间 出 现 的 0 用 于 标记 数字 的 偏 移 位 置 ， 即便 是 连续 
出 现 的 0 也 不 能 省 略 。 中 文 计数 方式 中 每 个 数字 的 权 位 都 直接 跟 在 数字 后 面 ， 因 此 可 以 用 一 个 
“ 零 ” 代 表 连 续 出 现 的 若干 个 0。 尽 管 如 此 ， 也 不 是 所 有 的 情况 都 使 用 “ 零 "， 比 如 阿拉 伯 数 字 
20001234， 中 文 数字 表示 为 “二 千 万 一 千 二 百 三 十 四 ”， 没 有 用 一 个 “ 零 ”"; 再 比如 阿拉 伯 数 字 
12000， 中 文 数字 表示 为 “一 万 二 千 ”， 也 没有 用 “ 零 ” ， 但 是 对 于 阿拉 伯 数字 10210300， 中 文 数 
字 表 示 为 0 万 零 三 百 ”， 两 次 出 现 “ 零 ”。 

中 文 数字 对 “ 零 ” 的 使 用 总 结 起 来 有 以 下 三 条 规则 。 

口 规则 1: 以 10000 为 小 节 ， 小 节 的 结尾 即使 是 0， 也 不 使 用 “ 零 ”。 

口 规则 2: 小 节 内 两 个 非 0 数字 之 间 要 使 用 “ 零 ”。 

口 规则 3: 当 小 节 的 “ 千 ” 位 是 0 时 ， 若 本 小 节 的 前 一 小 节 无 其 他 数字 ， 则 不 用 “ 
则 就 要 用 “ 零 ”。 


a 
芯 
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4.2 阿拉伯 数 字 转 中 文 数字 


阿拉 伯 数 字 与 中 文 数字 没有 一 一 对 应 关系 , 不 存在 直接 转换 的 公式 化 算法 , 因此 需要 根据 两 
种 数字 体系 的 特点 精心 构造 转换 算法 。 从 阿拉 伯 数 字 到 中 文 数字 的 转换 ,第 一 步 是 以 “万 ”为 单 
位 分 节 ， 并 确定 闻 权 位 。 第 二 步 是 对 每 小 节 内 的 数字 确定 权 位 ， 并 按照 本 章 4.1.2 节 给 出 的 三 条 
规则 处 理 “ 零 ”的 问题 。 


4.2.1 一 个 转换 示例 


以 阿拉 伯 数 字 200001010200 为 例 ， 首 先 以 “万 ”为 单位 对 其 分 节 ， 可 分 为 三 节 : 2000 0101 
0200, 第 一 节 2000, 节 权 位 是 “ 亿 ”， 因 为 这 一 节 的 0 都 在 结尾 , 根据 规则 1， 此 处 不 使 用 “ 零 ”， 
直接 表示 为 “二 千 亿 ”。 第 二 节 0101， 节 权 位 是 “万 ”， 因 两 个 1 之 间 有 0， 根据 规则 2，101 可 
以 描述 为 “一 百 零 一 ”。 男 外 ， 此 节 的 千 位 是 0, 根据 规则 3， 因 本 小 节 前 还 有 数字 ， 因 此 需要 用 
“ 零 ”。 也 就 是 说 , 本 小 节 需 要 两 个 “ 零 "。 最 后 一 个 小 节 , 结尾 的 两 个 0 根据 规则 1, 不 使 用 “ 零 ”， 
但 是 千 位 的 0 根据 规则 3， 需 要 使 用 “ 零 ”。 根 据 以 上 分 析 ， 将 三 个 小 节 的 转换 结果 组 合 在 一 起 ， 
阿拉 伯 数 字 200001010200 的 中 文 表示 就 是 “二 千 亿 零 一 百 零 一 万 零 二 百 ”。 

从 这 个 例子 可 以 看 出 来 ,对 阿拉 伯 数 字 分 节 , 确定 数字 的 权 位 很 简单 ， 最 难处 理 的 就 是 0 的 
转换 ， 需 要 根据 三 个 规则 灵活 选择 是 否 需 要 使 用 “ 零 ”。 


4.2.2 ”转换 算法 设计 


设计 阿拉 伯 数 字 转 中 文 数字 的 算法 , 也 可 以 遵循 上 例 中 的 两 个 步骤 来 处 理 , 但 是 需要 解决 三 
个 问题 。 第 一 个 问题 是 单个 数字 的 转换 ， 这 个 并 不 难 ， 因 为 阿拉 伯 数 字 0 ~9 与 相应 的 中 文 数字 
是 一 一 对 应 的 。 对 这 个 转换 设计 算法 非常 简单 ， 可 以 利用 第 2 章 介绍 的 数组 下 标的 技巧 ,这 样 定 
义 中 文 数字 表 : 


const char *chnNumChar[CHN_NUM CHAR_COUNT] = {“" 零 ",， "一 ",， "二 ",， "三",，" 四 ", "五 "，" 六 ", "七 "， 
"A "i" }; 


待 转换 的 阿拉 伯 数 字 作 为 数组 下 标 ， 比 如 chnNumChar[5] 就 是 阿拉 伯 数 字 $ 对 应 的 中 文 数 字 。 

第 二 个 需要 解决 的 问题 是 节 与 权 位 的 识别 。 节 的 划分 很 简单 ， 以 “万 ”为 单位 截断 即 可 。 节 
权 位 的 定义 也 采用 一 维 表 ， 可 以 利用 数组 下 标 直 接 定 位 出 节 权 的 中 文 名 称 : 

const char *chnUnitSection[] = {"", "万 ",，" 亿 ", "万 亿 " }; 

对 于 32 位 正 数 能 表达 的 最 大 数 来 说 ， 最 大 节 权 是 “万 亿 ” 已 经 足够 了 ， 如 果 要 转换 更 大 的 
数 ， 可 以 延伸 这 个 节 权 表 的 定义 ， 比 如 增加 “ 亿 亿 ”。 数 字 中 最 低 的 节 没 有 节 权 ， 使 用 空 字符 串 
作为 占 位 符 也 是 一 个 算法 设计 常用 的 一 致 性 处 理 的 技巧 : 对 最 低 的 节 不 做 特殊 处 理 ， 和 其 他 节 一 
样 指定 节 权 位 ， 只 不 过 节 权 位 是 空 字符 串 ， 对 转换 出 的 中 文 数字 最 终结 果 没 有 影响 。 每 个 节 内 的 
数字 对 应 的 权 位 也 采用 这 种 方式 定义 : 
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const char *chnynitChar[] = {"", "十 "," 百 "," 千 " }); 

最 低位 的 权 位 是 空 字 符 串 ,处理 方式 和 节 权 位 的 处 理 方式 一 样 。 数 字 权 位 的 确定 并 不 困难 ， 
通过 移 位 就 可 以 确定 每 个 数字 对 应 的 权 位 。 阿 拉 伯 数字 的 权 位 是 隐 含 在 数字 的 位 数 中 的 , 使 用 0 
作为 占 位 符 。 比 如 数字 1000, 要 使 1 处 在 千 位 , 一 定 会 补 3 个 0 作为 占 位 符 , 否则 1 就 不 代表 “一 
千 ”。 既 然 每 一 位 的 权 都 在 固定 的 位 置 上 ， 只 要 记录 移 位 的 次 数 就 可 以 确定 阿拉 伯 数 字 的 权 位 ， 
以 移 位 次 数 做 下 标 ， 直 接 查 chnUnitsection 和 chnUnitChar 表 就 可 以 得 到 正确 的 中 文 数字 的 权 位 。 


第 三 个 需要 解决 的 问题 是 如 何 处 理 中 文 “ 零 ”。 这 个 问题 稍微 有 点 困难 ， 需 要 根据 4.1.2 节 的 
三 个 规则 灵活 判断 ， 此 外 ， 对 于 连续 出 现 的 阿拉 伯 数 字 0， 也 只 能 用 一 个 中 文 “ 零 ”。 


4.2.3 ”算法 实现 


转换 算法 首先 要 对 阿拉 伯 数 字 分 节 ， 并 确定 节 权 位 名 称 。num 对 10000 取 模 可 得 到 一 个 
section， 将 这 个 section 转 成 中 文 数字 ， 然 后 根据 节 的 位 置 补 上 节 权 位 ， 即 可 完成 一 个 节 的 中 文 
数字 转换 。 重复 这 个 过 程 , 直到 num 等 于 0 为 止 , 整个 转换 就 算 完 成 。 unitPos 变量 记录 节 的 位 置 ， 
0 对 应 空 字符 串 ，1 对 应 “万 ”，2 对 应 “ 亿 ”， 随 着 unitPos 的 增加 ， 节 权 位 也 越 来 越 大 。 全 0 的 
节 不 需要 节 权 位 ， 这 个 在 代码 中 也 有 人 处理。 根据 4.1.2 节 规 则 3 的 定义 ， 如 果 一 节 内 数字 的 千 位 
是 0， 需 要 根据 前 面 是 否 还 有 数字 决定 是 否 需要 加 “ 零 ”，NumberToChinese() 羡 数 中 利用 变量 
needzero 和 while(num > 0) 循 环 语句 ， 巧 妙 地 做 了 这 个 加 “ 零 ” 处 理 ， 省 去 了 一 个 if 判断 。 

//num == 0 需要 特殊 处 理 ， 直 接 返回 " 零 " 


void NumberToChinese(unsigned int num, std::string& chnStr) 


{ 
int unitPos = 0; 
std::string strIns; 
bool need7zero = false; 


while(num > 0) 


{ 
unsigned int section = num % 10000; 
if(needZzero) 
‘ 
chnSstr.insert(0, chnNumChar[0]); 
} 
SectionToChinese(section, strIns); 
/* 是 否 需要 节 权 位 ?*/ 
strIns += (section != 0) ? chnUnitSection[unitPos] : chnUnitSection[0]; 
chnstr.insert(0, strIns); 
/* 千 位 是 0 需要 在 下 一 个 section 补 零 */ 
needZero = (section < 1000) 8& (section > 0); 
num = num / 10000; 
unitPos++; 
} 


} 
SectionToChinese() 函 数 将 一 个 节 的 数字 转换 成 中 文 数字 ， 利 用 中 文 数字 表 chnNumChar 转换 
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中 文 数 字 ， 利 用 表 chnunitChar 得 到 数字 权 位 ，unitpos 变量 用 作 权 位 索引 。SectionToChinese() 
函数 的 关键 部 分 是 对 0 的 处 理 ， 根 据 规则 1 和 规则 2， 小 节 结 尾 的 0 不 需要 转换 成 “ 零 ”, 但 是 两 
个 数字 之 间 的 0 需要 转换 成 “ 零 "。 如 果 两 个 数字 之 间 有 多 个 0， 也 只 转换 一 个 “ 零 ”， 变 量 zero 
用 于 控制 “ 零 ” 的 转换 ， 避 免 出 现 多 个 “ 零 ” 连 在 一 起 的 情况 。 


void SectionToChinese(unsigned int section, std::string& chnstT) 


std::string strIns; 
int unitPos = 0; 
bool zero = true; 
while(section > 0) 
int v = section % 10; 
if(v == 0) 
{ 
if(!zero) 
zero = true; /* 需 要 补 ，Zzero 的 作用 是 确保 对 连续 的 多 个 ， 只 补 一 个 中 文 零 */ 
chnStr.insert(0, chnNumChar[v]); 
} 
} 
else 
{ 
zero = false; // 至 少 有 一 个 数字 不 是 
strIns = chnNumChar[v]; // 此 位 对 应 的 中 文 数字 
strIns += chnUnitChar[unitPos]; // 此 位 对 应 的 中 文 权 位 
chnStTr.insert(0，stTIns); 
} 
unitPos++; // 移 位 
section = section / 10; 
} 
} 


4.2.4 ”中 文大 写 数字 


中 文 数字 还 有 一 个 很 有 意思 的 现象 ， 就 是 中 文 数字 大 写 。 所 谓 的 大 写 其 实 就 是 用 一 些 笔画 复 
杂 的 汉字 代替 简单 的 数字 汉字 , 其 目的 就 是 为 了 保证 其 不 容易 被 修改 。 中 文大 写 用 “过 起 会 肆 伍 
陆 业 撞 玖 ”代替 “一 二 三 四 五 六 七 八 九 "， 用 “ 拾 佰 他 ”代替 “十 百 千 "。 这 些 数字 的 繁 写 其 实在 
唐 代 就 已 经 出 现 ,但 正式 作为 记载 钱粮 、 税 收 等 项 目 用 的 官方 数字 ,是 在 明 朝 初 年 著 各 的 “部 本 
这 光志 有 


实现 中 文大 写 数字 的 转换 ， 只 需要 将 chnNumChar、chnuUnitsection 中 的 中 文 数字 和 权 位 名 称 


J 郭 桓 案 : 与 空 印 案 、 胡 惟 庸 案 和 蓝 玉 案 一 起 并 称 为 明 初 四 大 案 。 郭 桓 案 发 生 在 明 朝 洪武 十 八 年 (1385 年 )， 属 于 
官吏 贪污 案件 。 户 部 侍郎 郭 桓 等 人 ， 串 通 地 方 官 吏 作弊 ， 自 改 账册 ， 私 吞 太平 、 镇 江 等 府 的 赋税 ， 还 盗卖 官 粮 。 
后 被 揭发 ， 以 其 涉案 金额 巨大 ， 对 经 济 领 域 影响 深远 而 为 世人 瞩目 ， 对 此 ， 明 太 祖 将 六 部 左 、 右 侍郎 以 下 官员 全 
部 处 死 , 地 方 官吏 死 于 狱 中 者 达 数 万 人 以 上 。 为 了 追 赃 , 牵连 到 全 国 各 地 的 小 富 百 姓 , 遭 到 抄家 破产 的 不 计 其 数 。 

1 于 牵扯 面 过 广 ， 全 国 百姓 对 此 案 非 常 不 满意 ， 明 太 祖 为 了 平息 民怨 ， 将 审 刑 官 吴 庸 等 人 也 一 并 处 死 。 
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替换 成 大 写 数字 就 可 以 了 ,转换 算法 是 一 样 的 。 如 果 用 于 人 民 币 记 账 ， 可 调整 节 权 位 的 名 称 ， 加 
上 “ 圆 ” 或 “ 圆 整 ”等 权 名 ， 有 兴趣 的 读者 可 自行 完成 转换 代码 。 


4.3 ”中 文 数字 转 阿 拉 伯 数字 


中 文 数字 的 权 位 是 明 的 , 阿拉伯 数字 的 权 位 则 隐 含 在 数字 的 位 置 中 。 比 如 中 文 数字 “一 万 ”， 
对 应 的 阿拉 伯 数 字 是 10000， 如 何 确 定 补 多 少 个 0 才能 将 1 顶 在 正确 的 位 置 上 ? 这 正 是 中 文 数字 
转换 成 阿拉 伯 数 字 的 关键 ， 如 何 将 明 的 权 位 转换 成 数字 的 位 置 。 


4.3.1 转换 的 基本 方法 


对 于 十 进 制 阿拉 伯 数字 ,数字 的 所 在 位 数 就 是 该 数字 与 10 的 倍数 关系 。 个 位 就 是 1 倍 , 十 位 
就 是 10 倍 ， 百 位 就 是 100 倍 ， 以 此 类 推 。 通 过 这 个 关系 ， 可 以 将 阿拉 伯 数 字 隐 含 的 权 位 转换 成 
10 的 倍数 表示 ， 比 如 中 文 数字 “五 百 ”， 就 可 以 转换 成 Sx100， 其 结果 就 是 300。 再 来 看 一 个 复杂 
的 中 文 数字 “四 万 二 千 五 百 一 十 三 ”， 对 每 个 权 位 依次 转换 成 倍数 并 求 和 : 4x10000 + 2x1000 + 
5x100 +1x10+3x1， 就 可 以 得 到 对 应 的 阿拉 伯 数 字 42513。 

由 以 上 分 析 可 知 , 从 中 文 数字 转 阿 拉 伯 数字 的 基本 方法 就 是 从 中 文 数 字 中 逐个 识别 出 数字 和 
权 位 的 组 合 , 然后 根据 权 位 和 阿拉 伯 数 字 倍数 的 对 应 关系 计算 出 每 个 数字 和 权 位 组 合 的 值 , 最 后 
求 和 得 到 结果 。 但 是 中 文 数字 并 不 是 严格 用 “数字 ”+“ 权 位 ”组 合成 的 ,“ 零 ”的 使 用 就 是 个 特 
例 ， 它 在 数字 中 出 现 , 却 没 有 权 位 。 除 此 之 外 , 节 权 位 也 需要 考虑 ， 因 为 它 常 和 其 他 权 位 连 在 一 
起 使 用 ， 比 如 “二 十 万 ”中 的 “十 ”是 数字 权 位 ,“ 万 ”是 节 权 位 。 在 设计 算法 时 ， 由 于 “有 零 ” 
没有 权 位 ， 因 此 对 于 中 文 数 字 中 的 “ 零 ” 不 需 处 理 ， 直 接 跳 过 即 可 。 节 权 位 比较 特殊 ， 它 不 是 与 
之 相 邻 的 数字 的 倍数 ， 而 是 整个 小 节 的 倍数 ， 因 此 转换 过 程 中 ， 需 要 临时 保存 每 个 节 权 位 出 现 之 
前 的 小 节 的 值 。 


4.3.2 ”算法 实现 


中 文 数字 转换 成 阿拉 伯 数 字 的 算法 实现 , 首先 要 做 两 件 事情 , 一 件 是 将 中 文 数字 转换 成 阿拉 
伯 数 字 ， 另 一 件 事 情 就 是 将 中 文 权 位 转换 成 10 的 倍数 。 中 文 数字 转换 成 阿拉 伯 数 字 可 以 通过 反 
查 chnNumChar 表 实 现 。 将 中 文 权 位 转 成 10 的 倍数 需要 事先 建立 一 个 中 文 权 位 与 10 的 倍数 的 关系 
表 ， 我 们 这 样 定义 一 个 中 文 权 位 和 10 的 倍数 关系 : 


typedef struct 


const char *name; // 中 文 权 位 名 称 

int value; //10 的 倍数 值 

bool secUnit; // 是 否 是 节 权 位 
}CHN_NAME VALUE; 


根据 这 个 关系 的 定义 建立 的 权 位 与 10 的 倍数 的 关系 表 如 下 : 


4.3 ”中文 数字 转 阿 拉 伯 数字 三 53 


CHN NAME VALUE chnValuePair[] = 
{ 
{ "十 "，10, false }, {" 百 "，100,，false }, { " 千 ",，1000, false }， 
{ "万 "，10000，true },，{" 亿 "，100000000，true } 
}; 
根据 以 上 定义 实现 的 转换 算法 如 下 : 
unsigned int ChineseToNumber(const std::string& chnstring) 
{ 
unsigned int rtn = 0; 
unsigned int section = 0; 
int number = 0; 
bool secUnit = false; 
std::string::size type pos = 0; 


while(pos < chnString.length()) 


int num = ChineseToValue(chnString.substr(pos, CHN_CHAR_LENGTH)); 
if(num >= 0) /* 数 字 还 是 单位 ? */ 
{ 
number = num; 
pos += CHN_ CHAR LENGTH; 
if(pos >= chnString.length())// 如 果 是 最 后 一 位 数字 ， 直 接 结 
{ 
section += number; 
rtn += section,; 
break; 


| 


else 
{ 
int unit = ChineseToUnit(chnString.substr(pos, CHN_CHAR LENGTH), secUnit); 
if(secUnit)// 是 节 权 位 说 明 一 个 节 已 经 结束 
{ 
section = (section + number) * unit; 
rtn += section; 
section = 0; 
} 


else 


{ 
} 


number = 0; 
pos += CHN_ CHAR LENGTH; 
if(pos >= chnString.length()) 


section += (number * unit); 


rtn += section; 
break; 


} 


return rtn; 
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ChineseToNumber() 函 数 就 是 中 文 数字 转 阿 拉 伯 数 字 算法 的 主要 部 分 ，chnstring 参数 就 是 合法 
的 中 文字 符 串 ， 转 换 的 过 程 就 是 对 chnstring 中 的 中 文 逐 个 处 理 ， 如 果 遇 到 中 文 数 字 ， 就 存放 在 
number 变量 中 ， 对 于 “ 零 ” 不 处 理 ， 直 接 跳 过 。 如 果 是 中 文 权 位 ， 则 将 其 对 应 的 倍数 与 number 
相 乘 得 到 对 应 的 数字 ， 同 时 累加 到 section 变量 中 。 如 果 是 节 权 位 ， 则 将 节 权 位 对 应 的 倍数 与 
section 相 乘 得 到 对 应 的 数字 ， 同 时 累加 到 最 终 的 结果 rtn 变量 中 。CcChineseTovalue() 函数 负责 查 
表 完 成 中 文 数字 到 英文 数字 的 转换 ， 如 果 返 回 -1， 则 表示 这 是 一 个 权 位 字符 。ChineseToUnit() 治 
数 负责 查 chnvaluePair 表 得 到 权 位 对 应 的 10 的 倍数 。 


4.4 数字 转换 的 测试 用 例 


中 文 数字 的 表示 方法 随 着 地 域 的 不 同 也 有 一 些 差 异 ， 比 如 数字 11， 到 底 是 “十 一 ”还 是 “ 
十 一 ”? 再 比如 110， 到 底 是 “一 百 一 十 ”还 是 “一 百 一 ”? 其 实 这 些 转换 是 有 相应 的 国家 标准 
和 行业 规定 的 。 本 书 给 出 一 套 简 单 的 测试 用 例 , 很 多 读者 都 写 过 自己 的 中 文 数字 转换 算法 ,不 妨 
用 这 个 测试 用 例 检 验 一 下 ， 看 看 是 否 正 确 。 


{1015，" 一 千 零 一 十 五 "}， 
{1000，" 一 千 "}， 

{10000，" 一 万 "}， 

{20010，" 二 万 零 一 十 "}， 
{20001， "二 万 零 一 "小 
{100000，" 一 十 万 "}， 
{1000000，" 一 百 万 "}， 
{10000000，" 一 千 万 "}， 
{100000000，" 一 亿 "}， 
{1000000000，" 一 十 亿 "}， 
{1000001000，" 一 十 亿 一 千 "}， 
{1000000100，" 一 十 亿 替 一 百 "}， 
{200010，" 二 十 万 零 一 十 "}， 
{2000105,，" 二 百 万 零 一 百 零 五 "}， 
{20001007，" 二 千 万 一 千 替 七"}， 
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{2000100190，" 二 十 亿 零 一 十 万 零 一 百 九 十 "]}， 
{1040010000，" 一 十 亿 四 千 零 一 万 "}， 

{200012301，" 二 亿 堆 一 万 二 千 三 百 零 一 "}， 

{2005010010，" 二 十 亿 零 五 百 零 一 万 零 一 十 "]}， 

{4009060200， "四 十 亿 零 九 百 零 六 万 零 二 百 ")， 

{4294967295，" 四 十 二 亿 九 千 四 百 九 十 六 万 七 千 二 百 九 十 五 "} 


4.5 总 结 


中 文 数字 体系 有 自己 的 特点 ,在 财务 和 金融 系统 中 有 独特 的 用 处 ,与 轻巧 的 阿拉 伯 数 字 相 比 ， 
在 生活 中 使 用 和 表达 中 文 数字 确实 有 不 方便 的 地 方 , 但 是 跟 法 语 表 达 方 式 比 起 来 ,咱们 中 国人 也 
没什么 可 抱怨 的 。 不 信 你 问 问 法 国人 ， 怎 么 用 法 语 说 92 吧 。 
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第 .2 章 


三 个 水 梯 等 分 8 升水 的 问题 


有 这 样 一 道 智力 题目 : 有 三 个 容积 分 别 是 3 升 、5 升 和 8 天 


的 水 桶 ， 其 中 容积 为 8 升 的 水 桶 


中 装 满 了 水 ， 容 积 为 3 升 和 容积 为 5 升 的 水 桶 是 空 的 。 三 个 水 桶 都 没有 体积 刻度 ， 现 在 需要 将 大 
水 桶 中 的 8 升水 等 分 成 两 份 ， 每 份 都 是 4 升水 ， 附 加 条 件 是 只 能 使 用 另外 两 个 空 水 桶 ,不 能 借助 


其 他 辅助 容 需 。 


这 是 一 个 很 经 典 的 问题 , 但 是 并 不 难 ， 大 部 分 人 都 可 以 在 一 分 钟 内 给 出 答案 。 不 过 ， 


很 多 人 


可 能 没有 注意 到 ,这 个 问题 的 答案 不 止 一 个 。 先 来 看 一 个 最 常见 的 答案 , 也 是 目前 已 知 最 快 的 操 


作 步 又 ， 共 需要 7 次 倒 水 动作 : 


(1) 从 8 升水 桶 中 倒 5 升水 到 5 升水 桶 中 
(2) 从 5 升水 桶 中 倒 3 升水 到 3 升水 桶 中 
(3) 从 3 升水 桶 中 倒 3 升水 到 8 升水 桶 中 
(4) 从 5 升水 桶 中 倒 2 升水 到 3 升水 桶 中 
(5) 从 8 升水 桶 中 倒 5 升水 到 5 升水 桶 中 
(6) 从 5 升水 桶 中 倒 1 升水 到 3 升水 桶 中 
(7) 从 3 升水 桶 中 倒 3 升 水 到 8 升水 桶 中 


最 后 的 结果 是 5 升水 桶 和 8 升水 桶 中 各 有 4 升水 。 昨 


了 来 看 一 个 稍微 复杂 一 点 的 答案 ， 


案 需 要 8 次 倒 水 动作 : 
(1) 从 8 升水 桶 中 倒 3 升水 到 3 升水 桶 中 
(2) 从 3 升水 桶 中 倒 3 升水 到 5 升水 桶 中 
(3) 从 8 升水 桶 中 倒 3 升水 到 3 升水 桶 中 
(4) 从 3 升水 桶 中 倒 2 升水 到 $ 升水 桶 中 
(5) 从 5 升水 桶 中 倒 $ 升水 到 8 升水 桶 中 
(6) 从 3 升水 桶 中 倒 1 升水 到 $ 升水 桶 中 
(7) 从 8 升水 桶 中 倒 3 升水 到 3 升水 桶 中 
(8) 从 3 升水 桶 中 倒 3 升水 到 $ 升水 桶 中 


A 


人 


ds 


ds 


这 个 答 


5.1 问题 与 求解 思路 号 57 
到 底 有 多 少 种 答案 ?水 从 水 桶 之 间 倒 来 倒 去 , 情况 太 多 了 , 我 这 平 几 的 地 球 脑袋 搞 不 定 这 个 


问题 , 但 是 计算 机 可 以 。 设计 一 个 算法 , 让 计算 机 帮 我 们 把 所 有 的 答案 都 找 出 来 , 这 就 是 本 童 的 
内 容 。 在 写本 书 时 我 已 经 知道 答案 了 ， 我 没 想到 会 有 这 么 多 种 倒 水 方法 。 


5.1 问题 与 求解 思路 


如 果 用 人 的 思维 方式 , 那么 解决 这 个 问题 的 关键 是 怎么 通过 倒 水 凑 出 确定 的 1 升水 或 能 容纳 
1 升水 的 空间 , 三 只 水 桶 的 容积 分 别 是 3、5 和 8, 用 这 三 个 数 做 加 减 运算 , 可 以 得 到 很 多 组 答案 ， 
例如 : 


3-(5-3)=1l 
这 个 策略 对 应 了 上 面 提 到 的 第 一 种 解决 方法 ， 而 男 一 组 运算 : 
(3+3)- 3=1] 


则 对 应 了 上 面 提 到 的 第 二 种 解决 方法 。 

但 是 计算 机 并 不 能 理解 这 个 “1” 的 重要 性 ,很 难 按照 人 类 的 思维 方式 按部就班 地 推导 答案 ， 

因此 用 计算 机 解决 这 个 问题 ， 通 常会 选择 使 用 “ 穷 举 法 "。 为 什么 使 用 “ 穷 举 法 ” 呢 ? 因为 这 不 
是 一 个 典型 意义 上 的 求解 最 优 解 的 问题 , 虽然 可 能 暗含 了 求解 倒 水 次 数 最 少 的 方法 的 要 求 , 但 就 
本 质 而 言 , 常用 的 求解 最 优 解 问题 的 高 效 方法 都 不 适用 于 此 问题 。 如 果 能 够 穷 举 解 空间 的 全 部 合 
法 解 ， 然后 通过 比较 找到 最 优 解 也 是 一 种 求解 最 优 解 的 方法 。 不 过 就 本 题 题 意 而 言 ， 并 不 关心 什 
么 方法 最 快 ， 能 求 出 全 部 等 分 水 的 方法 可 能 更 符合 题 意 。 
使 用 “ 穷 举 法 ”， 首 先 要 定义 问题 的 解 ， 并 分 析 解 空间 的 范围 和 拓扑 结构 ， 然 后 根据 解 空间 
的 范围 和 拓扑 结构 设计 遍历 搜索 算法 。 如 果 我 们 把 某 一 时 刻 三 个 水 桶 中 存 水 的 情况 称 为 一 个 状 
态 ， 则 问题 的 初始 状态 是 8 升 的 水 桶 装 满 水 ，3 升 和 5 升 的 水 桶 为 空 。 最 终 要 求 的 解 的 状态 就 是 
3 升 的 水 桶 为 空 ，5 升水 桶 和 8 升水 桶 各 4 升水 。 针 对 此 问题 的 “ 穷 举 法 ”的 实质 就 是 从 初始 状 
态 开始 , 根据 某 种 状态 变化 的 规则 搜索 全 部 可 能 的 状态 , 每 当 找到 一 个 从 初始 状态 到 最 终 状 态 的 
变化 路 径 , 就 可 以 理解 为 找到 了 一 个 解 , 这 条 从 初始 状态 到 最 终 状 态 的 路 径 就 是 倒 水 问题 的 一 种 
答案 。 

状态 都 是 静止 的 ， 从 初始 状态 到 最 终 状 态 的 变化 需要 一 种 “推动 力 ”， 接 下 来 需要 找到 一 种 
“推动 力 ”推动 状态 发 生变 化 。 这 个 “推动 力 ”就 是 隐 含 在 问题 描述 中 的 “ 倒 水 动作 ”， 每 个 动作 
实施 的 结果 就 是 从 一 个 水 桶 倒 水 到 另 一 个 水 桶 , 水 桶 中 水 的 状态 就 发 生变 化 了 , 于 是 状态 也 就 变 
化 了 。 如 果 能 找到 一 种 方式 ,持续 地 促使 倒 水 动作 发 生 , 使 得 状态 能 不 停 地 随 动作 变化 ,， 那 就 等 
于 找到 了 本 问题 的 解 空 间 搜索 方法 。 
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5.2 ”建立 数学 模型 


根据 上 一 节 的 分 析 , 求解 这 个 问题 的 算法 本 质 上 就 是 对 状态 的 穷 举 搜索 。 这样 状态 变化 搜索 
的 结果 通常 是 得 到 一 棵 状态 搜索 树 , 根 节点 是 初始 状态 , 叶子 节点 可 能 是 最 终 状 态 , 也 可 能 是 某 
个 无 法 转换 到 最 终 状 态 的 中 间 状 态 。 状 态 树 有 和 多少 个 最 终 状态 的 叶子 节点 , 就 有 多 少 种 答案 。 由 
此 可 知 , 解决 本 问题 的 算法 关键 是 建立 状态 和 动作 的 数学 模型 ,并 找到 一 种 持续 驱动 动作 产生 的 
搜索 方法 。 

本 问题 并 不 复杂 ， 因 此 建立 数学 模型 的 工作 就 “退化 ”成 建立 描述 问题 的 数据 结构 。 前 面 定 
义 的 状态 都 是 静止 状态 , 完整 的 状态 模型 不 仅 要 能 够 描述 静止 状态 , 还 要 能 够 描述 并 记录 状态 转 
换 动作 , 尤其 是 对 状态 转换 的 描述 ， 因 为 这 会 影响 到 状态 树 搜索 算法 的 设计 。 先 来 看 看 状态 模型 
以 及 状态 树 的 设计 。 


5.2.1 状态 的 数学 模型 与 状态 树 


所 谓 的 静止 状态 ， 就 是 某 一 时 刻 三 个 水 桶 中 存留 水 的 体积 。 我 们 采用 长 度 为 3 的 一 维 向 量 描 
述 这 个 状态 ,这 组 向 量 的 三 个 值 分 别 是 容积 为 8 升 的 桶 中 的 水 量 、 容 积 为 5 升 的 桶 中 的 水 量 和 容 
积 为 3 升 的 桶 中 的 水 量 。 因 此 算法 的 初始 状态 就 可 以 描述 为 [8, 0, 0]， 则 终止 状态 为 [4, 4, 0]。 

倒 水 动作 与 静止 状态 的 结合 就 产生 了 状态 变化 , 持续 的 状态 变化 就 产生 了 一 棵 状态 树 , 这 个 
状态 树 上 的 所 有 状态 就 构成 了 穷 举 算法 的 解 空间 。 以 初始 状态 [8, 0,0] 为 例 ， 如果 与 “ 倒 5 升水 到 
5 升水 桶 ”动作 相 结 合 ， 就 得 到 了 一 个 新 状态 [3, 5, 0]， 同 样 ， 如 果 与 “ 倒 3 升水 到 3 升水 桶 ” 动 
作 相 结合 ， 就 得 到 了 另 一 个 新 状态 [5, 0, 3]。 以 此 类 推 ， 可 以 得 到 如 图 5-1 所 示 的 状态 树 。 


图 5-1 状态 树 结 构 示意 图 


5.2 ”建立 数学 模型 三 59 


[8, 0, 0] 是 状态 树 的 根 , 图 5-1 只 画 出 了 这 棵 状态 树 的 一 部 分 ， 图 中 深 颜色 背景 标识 出 的 几 个 
状态 是 状态 树 的 一 个 分 支 ,也 是 一 个 正确 的 解 的 状态 转换 路 径 。 根 据 题目 的 意图 ， 最终 的 结果 是 
要 输出 这 条 转换 路 径 的 倒 水 过 程 , 实际 上 就 是 与 状态 转换 路 径 相对 应 的 动作 路 径 或 动作 列表 。 当 
定义 了 动作 的 数学 模型 后 , 就 可 以 根据 状态 图 中 状态 转换 路 径 反 推出 对 应 的 动作 列表 。 依次 输出 
这 个 动作 列表 就 可 以 得 到 一 个 倒 水 过 程 的 答案 。 


5.2.2” 倒 水 动作 的 数学 模型 


两 个 静态 状态 是 通过 倒 水 动作 建立 关联 的 , 这 里 说 的 倒 水 动作 必须 是 合法 的 倒 水 动作 。 因 为 
水 桶 是 没有 体积 刻度 的 , 因此 倒 水 动作 也 就 不 能 是 任意 的 倒 水 行为 。 一 个 合法 的 倒 水 动作 的 前 提 
条 件 是 倒 出 水 的 桶 中 有 水 且 倒 信 水 的 桶 中 还 有 空间 。 分析 一 下 ,实际 上 就 两 种 情况 ， 一 种 是 倒 人 
水 的 桶 中 的 空间 足够 大 , 则 倒 出 水 的 桶 中 的 水 全 部 加 到 倒 入 水 的 桶 中 ,此 时 个 出 水 的 桶 成 为 空 桶 ; 
另 一 种 情况 就 是 倒 信 水 的 桶 中 的 空间 不 够 大 ， 只 能 倒 一 部 分 水 ， 此 时 倒 出 水 的 桶 中 还 剩 有 水 。 
一 个 合法 的 倒 水 动作 包含 三 个 要 素 : 倒 出 水 的 桶 、 倒 和 人 水 的 桶 和 倒 水 体积 。 我 们 用 一 个 三 元 5 
组 来 描述 倒 水 动作 : {from, to, water}, from 是 指 从 哪个 桶 中 倒 水 , to 是 指 将 水 倒 向 哪个 桶 , water 
是 此 次 倒 水 动作 所 倒 的 水 量 。 倒 水 动作 的 数据 结构 定义 如 下 : 


typedef struct tagACTION 


{ 
int from; 
int to; 
int water; 
}ACTION; 


某 一 时 刻 三 个 水 桶 中 的 存 水 状态 , 经 过 某 个 倒 水 动作 后 演变 到 一 个 新 的 存 水 状态 , 这 是 对 状 
态 转 换 的 文字 描述 ， 对 算法 来 讲 ， 倒 水 状态 描述 就 是 “静止 状态 ”+ “ 倒 水 动作 ”。 将 静止 状态 
和 倒 水 动作 组 合 在 一 起 的 原因 是 为 了 结果 输出 , 因为 此 问题 最 终 的 答案 是 要 求 提供 如 何 倒 水 的 过 
程 。 包 含 动作 的 倒 水 状态 定义 如 下 。 


struct BucketState 


i bucket s[BUCKETS COUNT]; 
ACTION curAction; 
}; 
本 模型 的 特例 就 是 第 一 个 状态 如 何 得 到 , 也 就 是 [8, 0, 0] 这 个 状态 对 应 的 倒 水 动作 如 何 描 述 ? 
我 们 用 -1 表示 未 知 的 水 桶 编号 (上帝 水 桶 )， 因 此 第 一 个 状态 对 应 的 倒 水 动作 就 是 二 1 1 8}。 应 
用 本 模型 对 前 面 提 到 的 第 一 种 解决 方法 进行 状态 转换 描述 ， 整 个 过 程 如 图 5-2 所 示 。 
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和 [8,0,0] {1,2,5} [3,5,0] {2,3,3} [3,2,3] 
do/{—1,1,8} do/{1,2,5} do/{2,3,3} 


[1,5,2] {1,2,5} [6,0,2] {2,3,2} [6,2,0] 
do/{1,2,5} do/{2,3,2} do/{3,1,3} 
{2,3,1} 


[1,4,3] {3,1,3} [4,4,0] 
do/231} [| do/{3,1,3} -© 
图 5-2 组合 状态 转换 过 程 示 意 医 
坏人 锡 、 


确定 了 状态 模型 后 ， 就 需要 解决 算法 面临 的 第 二 个 问题 : 状态 树 的 搜索 算法 。 一 个 静止 状态 
结合 不 同 的 倒 水 动作 会 迁移 到 不 同 的 状态 , 所 有 状态 转换 所 展示 的 就 是 一 棵 如 图 5-1 所 示 的 状态 
树 。 对 于 本 问题 来 说 ,这 个 状态 树 最 初 只 有 一 个 根 节点 , 整 棵 树 的 展开 是 随 着 搜索 算法 逐步 展开 
的 。 对 于 树 状 结构 的 搜索 , 可 以 采用 深度 优先 搜索 (DFS ) 算 法 , 也 可 以 采用 广度 优先 搜索 (BFS ) 
算法 。 两 种 方法 各 有 优 缺 点 , 广度 优先 搜索 的 优点 是 不 会 因为 状态 重复 出 现 而 导致 搜索 时 出 现状 
态 环 路 , 缺点 是 需要 比较 多 的 存储 空间 记录 中 间 状 态 。 深度 优 先 搜索 的 优点 是 在 同一 时 间 只 需要 
存储 从 根 节点 到 当前 搜索 状态 节点 这 一 条 路 径 上 的 状态 节点 , 需要 的 存储 空间 比较 小 , 缺点 是 要 
对 搜索 过 程 中 因 出 现 重复 状态 导致 的 状态 环 路 做 特殊 处 理 ， 避 免 状态 搜索 时 出 现 死 循环 的 情况 。 

状态 树 的 搜索 就 是 对 整个 状态 树 进行 遍历 , 其 中 上 暗含 了 状态 的 生成 ,因为 状态 树 一 开始 并 不 
完整 ， 只 有 一 个 初始 状态 的 根 节 点 ， 当 搜索 ( 也 就 是 遍历 ) 操作 完成 时 ， 状 态 树 才 完整 。 前 面 已 
经 提 到 ,， 树 的 遍历 可 以 采用 广度 优先 遍历 算法 ,也 可 以 采用 深度 优先 遍历 算法 。 就 本 题 而 言 ， 要 
求解 所 有 可 能 的 等 分 水 的 方法 , 暗含 了 要 记录 从 初始 状态 到 最 终 状 态 , 所 以 更 适合 使 用 深度 优先 
遍历 算法 。 


5.3.1 状态 树 的 遍历 


状态 树 的 遍历 暗含 了 状态 生成 的 过 程 , 就 是 促使 状态 树 上 的 一 个 状态 向 下 一 个 状态 转换 的 驱 
动 过 程 , 这 是 一 个 很 重要 的 部 分 ， 如 果 不 能 正确 地 驱动 状态 变化 ， 就 不 能 实现 状态 树 的 遍历 ( 搜 
索 )。 建 立 状 态 模型 一 节 中 提 到 的 动作 模型 ， 就 是 驱动 状态 变化 的 关键 因子 。 对 一 个 状态 来 说 ， 
它 能 转换 到 哪些 新 状态 ,取决 于 它 能 应 用 哪些 倒 水 动作 ,一 个 倒 水 动作 能 够 在 原状 态 的 基础 上 “ 生 
成 ”一 个 新 状态 ,不 同 的 倒 水 动作 可 以 “生成 ”不 同 的 新 状态 。 由 此 可 知 ， 状 态 树 遍历 的 关键 是 
找到 三 个 水 桶 之 间 所 有 合法 的 倒 水 动作 ， 用 这 些 倒 水 动作 分 别 “ 生 成 ”各 自 相应 的 新 状态 。 
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遍历 三 个 水 桶 所 有 可 能 的 倒 水 动作 , 就 是 对 三 个 水 桶 任 取 两 个 进行 全 排列 , 这 种 排列 的 结果 
可 以 得 到 6 种 水 桶 的 排列 关系 ， 这 也 就 意味 着 有 6 种 可 能 的 倒 水 动作 。 将 这 6 种 倒 水 动作 依次 应 
用 到 当前 状态 ， 就 可 以 “生成 ”6 种 新 状态 ， 从 而 驱动 状态 发 生变 化 。 但 是 ， 受 当前 水 桶 的 状态 
的 影响 ,并 不 是 6 种 排列 关系 都 能 组 合 出 合法 的 倒 水 动作 。 例 如 , 我 们 给 三 个 水 桶 编号 1、2、3， 
取 1 号 水 桶 和 3 号 水 桶 得 到 一 个 排列 关系 (13 )， 意 味 着 从 1 号 水 桶 向 3 号 水 桶 倒 水 ， 但 是 如 果 
1 号 水 桶 没有 水 , 或 者 3 号 水 桶 已 经 满 了 , 则 无 法 进行 从 1 号 水 桶 向 3 号 水 桶 倒 水 的 动作 。 因 此 ， 
在 组 合 倒 水 动作 时 ， 需 要 结合 当前 三 个 水 桶 的 存 水 状态 判断 是 否 是 合法 的 倒 水 动作 。 
BucketSstate::CanTakeDumpAction() 函 数 负责 做 这 个 判断 ， 其 实现 代码 如 下 : 


bool BucketState::CanTakeDumpAction(int from, int to) 


assert((from >= 0) && (from < BUCKETS COUNT)); 
assert((to >= 0) && (to «< BUCKETS COUNT)); 


/* 不 是 同一 个 桶 ， 且 from 桶 中 有 水 ， 且 to 桶 中 不 满 */ 
if( (from != to) 
&& lIsBucketEmpty(from) 
&& lIsBucketFull(to) ) 
{ 
return true; 


} 


return false; 


from 是 倒 出 水 的 水 桶 编号 ，to 是 接收 水 的 水 桶 编号 。 判 断 的 依据 有 三 个 : 第 一 ,不 能 向 自身 
倒 水 ; 第 二 ， 倒 出 水 的 桶 不 能 为 空 桶 ; 第 三 ， 接 收 水 的 桶 必需 有 空间 接收 水 ， 不 能 是 满 桶 状态 。 


5.3.2 ”前 枝 和 重复 状态 判断 


上 一 节 提 到 ,采用 深度 优先 搜索 状态 树 , 会 遇 到 重复 状态 导致 的 状态 环 路 。 比 如 ,假设 某 一 
时 刻 从 1 号 桶 倒 3 升 水 到 3 号 桶 ， 下 一 个 时 刻 又 从 3 号 桶 倒 3 升 水 到 1 号 桶 ， 此 时 水 桶 的 状态 就 
又 回 到 了 之 前 的 状态 , 这 就 形成 一 个 状态 环 路 。 有 时 候 状 态 环 路 可 能 复杂 一 点 ， 儿 个 状态 之 后 才 
出 现 重 复 状 态 ， 图 5-1 展示 的 就 是 一 种 复杂 一 点 的 状态 环 路 。 在 状态 [3, 5,0] 一 [3,2,3] 一 [6,2,0] 
一 [3,5, 0] 的 转换 过 程 中 ，[3, 5, 0] 状 态 再 次 出 现形 成 状态 环 路 。 如 果 对 这 种 情况 不 做 处 理 ， 状 态 
搜索 就 会 在 某 个 状态 树 分 支 陷 入 死 循 环 , 永远 无 法 到 达 正 确 的 结果 状态 。 除 此 之 外 ， 如 果 对 一 个 
状态 树 分 支 上 的 某 个 状态 经 过 搜索 , 其 结果 已 经 知道 , 则 在 男 一 个 状态 树 分 支 上 搜索 时 再 遇 到 这 
个 状态 时 ,可 以 直接 给 出 结果 , 或 跳 过 搜索 ， 以 便 提高 搜索 算法 的 效率 。 在 这 个 过 程 中 因 重 复出 
现 被 放弃 或 跳 过 的 状态 ， 可 以 理解 为 男 一 种 形式 的 “ 剪 校 ”"， 可 以 使 一 次 深度 优先 遍历 很 快 收敛 
到 初始 状态 。 

考虑 到 上 述 两 种 情况 , 需要 对 当前 深度 遍历 过 程 中 经 过 的 搜索 路 径 上 所 有 已 经 搜索 过 的 状态 
做 一 个 记录 ,形成 一 个 当前 已 经 处 理 过 的 状态 表 。 每 次 因为 动作 组 合生 成 新 状态 时 ， 都 检查 一 下 
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是 否 在 这 个 记录 中 有 状态 相同 的 记录 , 如 果 存 在 状态 相同 的 记录 则 跳 过 这 个 新 状态 ,回溯 到 上 一 
步 继续 处 理 下 一 个 状态 。 如 果 新 状态 是 状态 表 中 没有 的 状态 ,， 则 将 新 状态 加 入 到 状态 表 ， 然 后 从 
新 状态 开始 继续 深度 优先 遍历 。 

本 问题 还 有 一 个 要 求 ， 就 是 在 搜索 到 一 个 最 终 状 态 时 , 输出 搜索 过 程 中 记录 的 状态 ,以 便 还 
原 整 个 过 程 的 倒 水 动作 。 这 也 需要 一 个 列表 用 于 记录 一 次 深度 优先 遍历 过 程 中 已 经 处 理 过 的 状 
态 , 算法 设计 时 可 以 考虑 将 这 两 个 表 合 二 为 一 。 如 此 一 来 ,这 个 存放 状态 记录 的 列表 不 仅 要 支持 
从 一 端 插入 和 删除 状态 ， 还 要 支持 从 头 到 尾 遍 历 所 有 记录 。 从 这 两 方面 考虑 ,我 们 采用 双 端 队列 
数据 结构 来 维护 这 个 记录 列表 。 利 用 C++ 的 STL 提供 的 便利 ， 可 以 很 简单 地 实现 状态 重复 判断 
的 算法 ，IsProcessedState() 函 数 就 是 算法 的 实现 代码 。 


bool IsProcessedState(std::deque<BucketState>% states, const BucketState& newState) 
{ 


std::deque<BucketState>::iterator 让 = states.end(); 


it = find if( states.begin(), states.end(), 
std::bind2nd(std::ptr fun(IsSameBucketState), newSstate) ); 


return (it != states.end()); 
} 
find_if() 算 法 需要 一 个 仿 画 数 ， 我 不 想 再 写 一 个 果 数 对 象 ， 只 好 利用 两 个 函数 适配器 重用 了 
一 个 已 经 存在 的 普通 函数 IsSameBucketSstate()。 如 果 有 C++ 11 的 编译 器 , 可 以 利用 lamda 表达 式 
改写 这 个 算法 。 
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状态 树 的 搜索 是 一 个 递归 实现 的 过 程 : 从 初始 状态 开始 , 由 第 一 个 合法 的 倒 水 动作 得 到 一 个 
新 的 状态 ， 记 录 这 个 状态 ， 并 从 这 个 新 状态 开始 递归 搜索 。 在 一 个 分 支 搜索 完成 后 〈 无 论 是 否 得 
到 结果 )， 取 消 这 个 状态 ， 然 后 从 下 一 个 合法 的 倒 水 动作 再 得 到 一 个 新 状态 ， 然 后 从 这 个 状态 开 
始 继续 搜索 ， 直 到 遍历 完 所 有 合法 的 倒 水 动作 。 

这 是 一 个 递归 算法 ,状态 树 搜索 必须 有 一 个 终止 条 件 ， 否则 算法 无 法 收敛 。 那么 本 问题 的 状 
态 搜 索 的 终止 条 件 是 什么 ? 这 要 从 两 方面 看 ,一 方面 是 倒 水 动作 的 遍历 ,这 是 一 个 排列 组 合 问题 ， 
排列 完 所 有 组 合 就 是 结束 条 件 。 男 一 方面 是 状态 判断 ， 如果 出 现 了 等 分 水 的 最 终 状 态 , 则 可 以 结 
束 对 状态 树 上 当前 分 支 的 搜索 。 

Searchstate() 函 数 就 是 状态 搜索 算法 的 核心 ， 这 个 函数 首先 检查 当前 状态 列表 的 最 后 一 个 状 
态 是 否 是 结果 需要 的 最 终 状 态 〈[4, 4, 0] )， 如 果 是 最 终 状 态 ， 就 表示 搜索 到 一 个 结果 ， 通 过 调用 
PrintResult() 函 数 遍 历 状 态 列 表 ， 输 出 当前 结果 状态 转换 的 整个 过 程 〈 倒 水 动作 序列 )。 如 果 当 
前 状态 不 是 最 终 状态 ,就 通过 一 个 两 重 循环 遍历 6 种 可 能 的 倒 水 动作 , 将 这 些 动作 分 别 与 当前 状 
态 结合 形成 新 的 状态 ， 然 后 继续 搜索 新 的 状态 。 
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void SearchState(std::deque<BucketState>& states) 

{ 
BucketState current = states.back(); /* 每 次 都 从 当前 状态 开始 */ 
if(current.IsFinalState()) 


PrintResult(states); 
return; 


} 
/* 使 用 两 重 循环 排列 组 合 种 倒 水 状态 */ 
for(int j = 0; j < BUCKETS COUNT; ++j) 


{ 
for(int i = 0; i < BUCKETS COUNT; ++i) 


SearchStateOnAction(states, current, i, j); 


} 
} 
} 


搜索 算法 的 递归 关系 是 通过 searchstateOnAction() 孔 数 实现 的 ， 首 先 调用 BucketState:: 
CanTakeDumpAction() 函 数 判 断 能 和 否 组 合 一 个 从 from 到 to 的 倒 水 动作 ， 然 后 调用 BucketSstate:: 
Dumpwater() 函 数 实 现 倒 水 动作 ， 并 得 到 一 个 新 状态 。 接 着 调用 IspProcessedstate() 函 数 判断 这 个 
状态 是 否 是 被 处 理 过 的 状态 ,如 果 是 没有 被 处 理 过 的 新 状态 , 则 将 这 个 新 状态 加 入 到 已 搜索 状态 
记录 表 ， 并 调用 Searchstate() 函 数 继续 搜索 。 


void SearchStateOnAction(std: :deque<BucketState>& states, BucketState& current, int from, int to) 


if(current.CanTakeDumpAction(from, to)) 


{ 


BucketState next; 

/* 从 from 到 to 倒 水 ， 如 果 成 功 ， 返 回 倒 水 后 的 状态 */ 
bool bDump = current.DumpWater(from, to, next); 
if(bDump 8&& !IsProcessedState(states, next)) 

{ 
states.push back(next); 
SearchState(states); 
states.pop back(); 


} 

BucketState::Dumpwater() 也 是 一 个 很 有 意思 的 孔 数 。 前 面 介 绍 的 BucketState::CanTake 
DumpAction() 函 数 只 是 判断 从 from 到 to 能 否 组 合 出 倒 水 动作 , 而 这 个 函数 则 是 完成 实际 倒 水 动作 
的 具体 算法 实现 。 首 先 计算 to 水桶 的 剩余 容积 ， 然 后 根据 from 水 桶 中 的 水 量 决定 本 次 能 倒 多 少 
水 ， 如 果 from 水 桶 中 剩余 水 量 比 to 水桶 中 的 剩余 容积 小 ， 则 from 水 桶 被 倒 空 。 真 正 的 倒 水 动作 

其 实 就 从 from 桶 中 减 去 倒 水 量 , 在 to 水 桶 加 上 对 应 的 倒 水 量 。 如 果 倒 水 成 功 ， 最 后 调用 
BucketState: :SetAction() 函 数 将 倒 水 动作 三 元 组 与 新 状态 绑 定 ， 得 到 一 个 动态 的 倒 水 动作 状态 ， 
新 状态 通过 next 参数 返回 。 


bool BucketState::DumpWater(int from, int to, BucketState& next) 
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next .SetBuckets(bucket s); 
int dump water = bucket capicity[to] - next.bucket s[to]; 
if(next.bucket s[from] >= dump water) 


next.bucket s[to] += dump water; 
next.bucket s[from] -= dump water; 
+ 
else 
{ 
next.bucket s[to] += next.bucket s[from]; 
dump water = next.bucket s[from]; 
next.bucket s[from] = 0; 


} 
if(dump_water > 0) /* 是 一 个 有 效 的 倒 水 动作 ?*/ 
{ 


next.SetAction(dump water, from, to); 
return true; 


} 


return false; 


5.5 总 结 


本 章 开始 给 出 了 三 个 水 桶 等 分 8 升水 问题 的 两 个 答案 ,实际 答案 不 止 两 个 。 我 用 图 5-1 所 示 
的 画 状态 图 的 方法 手 推 答案 ， 推 算 到 第 6 种 方法 的 时 候 就 放弃 了 。 需要 搜索 的 状态 很 多 , 需要 逐 
个 判断 状态 的 处 理 情况 ， 还 是 让 计算 机 做 吧 。 用 本 章 的 算法 穷 举 之 后 ， 一 共 找 到 了 16 种 倒 水 的 
方法 ,最 快 的 方法 需要 7 个 步骤 ,也 就 是 本 章 给 出 的 第 一 种 方法 。 如 果 不 用 算法 ,你 能 给 出 几 种 
倒 水 方法 呢 ? 试 试看 吧 。 
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第 CO 章 


妖怪 汪 和 疝 过 河 问题 


这 是 一 个 从 www.plastelina.net 网 站 下 载 的 Flash 小 游戏 ， 如 图 6-1 所 示 。 有 三 个 和 尚 和 三 个 
妖怪 (也 可 翻译 为 传教 士 和 食 人 妖 ) 要 利用 唯一 一 条 小 船 过 河 ， 这 条 小 船 一 次 只 能 载 两 个 人 ， 同 
时 ,无 论 是 在 河 的 两 岸 还 是 在 船上 ， 只 要 妖怪 的 数量 大 于 和 尚 的 数量 ， 妖 怪 们 就 会 将 和 尚 吃 掉 。 
现在 需要 选择 一 种 过 河 的 安排 ,保证 和 尚 和 妖怪 都 能 过 河 且 和 尚 不 能 被 妖怪 吃 掉 。 

命 Flash =|D| xl 


Fle View Control Help 


图 6-1 ”妖怪 与 和 尚 过 河 游戏 


这 其 实 是 一 个 很 简单 的 游戏 , 过 河 的 策略 就 是 无 论 何 时 都 要 保证 在 河 的 任意 一 侧 和 尚 数量 多 
于 妖怪 。 先 来 看 一 种 过 河 的 方法 。 

(1) 两 个 妖怪 先 过 河 ， 一 个 妖怪 返回 ; 

(2) 再 两 个 妖怪 过 河 ， 一 个 妖怪 返回 ; 

(3) 两 个 和 尚 过 河 ， 一 个 妖怪 和 一 个 和 尚 返回 ; 

(4) 两 个 和 尚 过 河 ， 一 个 妖怪 返回 ; 

(5) 两 个 妖怪 过 河 ， 一 个 妖怪 返回 ; 

(6) 两 个 妖怪 过 河 。 
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我 现在 知道 ， 这 个 游戏 的 答案 不 止 一 个 ， 到 底 有 几 个 答案 呢 ? 写 个 算法 来 找 找 吧 。 


6.1 问题 与 求解 思路 


题目 的 初始 条 件 是 三 个 和 尚 和 三 个 妖怪 在 河 的 一 边 , 和 它们 在 一 起 的 还 有 一 条 小 船 。 过 河 后 
的 情况 应 该 是 三 个 和 尚 和 三 个 妖怪 安全 地 过 到 河 的 对 岸 ,虽然 没有 明确 提 到 船 的 状态 , 但 是 船 也 
应 该 跟着 到 了 对 岸 ， 否则 岂 不 闹鬼 了 ? 我 们 看 这 个 问题 里 的 三 个 关键 因素 ,就 是 和 尚 、 妖 怪 和 小 
船 ， 当 然 , 还 有 它们 的 位 置 。 假 如 我 们 要 让 计算 机 理解 这 个 问题 ， 除 了 对 这 三 个 事物 进行 描述 ， 
还 要 定义 它们 的 位 置信 息 。 如 果 把 任意 时 刻 妖 怪 、 和 尚 和 小 船 的 位 置信 息 合 在 一 起 看 作 一 个 “ 状 
态 ”"， 则 要 解决 这 个 问题 只 需要 找到 一 条 从 初始 状态 变换 到 终止 状态 的 路 径 即 可 。 这 就 有 点 类 似 
于 第 5 章 介绍 的 用 三 个 水 桶 等 分 8 升水 的 问题 , 我 们 可 以 尝试 使 用 第 5 章 介 绍 的 穷 举 方法 ,遍历 
所 有 由 妖怪 、 和 尚 和 小 船 的 位 置 构 成 的 状态 空间 ,寻找 一 条 或 多 条 从 初始 状态 到 最 终 状态 的 转换 
路 径 。 

从 初始 状态 开始 ,通过 构造 特定 的 搜索 算法 ， 对 状态 空间 中 的 所 有 状态 进行 穷 举 ， 就 得 到 一 
棵 以 初始 状态 为 根 的 状态 树 。 如 果 状 态 树 上 某 个 叶子 节点 是 题目 要 求 的 最 终 状 态 , 则 从 根 节点 到 
此 叶子 节点 之 间 的 所 有 状态 节点 就 是 一 个 过 河 问题 的 解决 过 程 。 从 初始 状态 开始 , 每 选择 一 批 妖 
怪 或 和 尚 过 河 ， 就 会 从 原状 态 产生 一 个 新 的 状态 。 如 果 以 人 类 思维 解决 这 个 问题 ， 每 次 都 会 选择 
最 佳 的 妖怪 与 和 尚 组 合 过 河 , 使 得 它们 过 河 后 生成 的 新 状态 更 接近 最 终 状态 ,不断 重复 上 述 过 程 ， 
直到 得 到 最 终 状态 。 在 这 个 过 程 中 ， 人 的 选择 是 推动 状态 转换 的 驱动 力 。 用 计算 机 解决 妖怪 与 和 
尚 过 河 问题 的 思路 也 是 通过 状态 转换 ,找到 一 条 从 初始 状态 到 结束 状态 的 转换 路 径 。 计算 机 不 会 
进行 理性 分 析 ， 不 知道 每 次 如 何 选择 最 佳 的 过 河 方式 , 但 是 计算 机 擅长 快速 计算 且 不 知 疲劳 ， 既 
然 不 知道 如 何 选择 过 河 方式 ,， 那 就 干脆 把 所 有 的 过 河 方式 都 尝试 一 遍 , 找 出 所 有 可 能 的 结果 ,， 当 
然 也 就 包括 成 功 过 河 的 结果 。 也 就 是 说 , 用 计算 机 求解 这 个 问题 , 穷 举 各 种 动作 尝试 就 是 推动 状 
态 变化 的 驱动 力 。 


6.2 ”建立 数学 模型 


本 章 介绍 的 算法 和 第 5 章 的 算法 类 似 , 都 是 从 一 个 根 状态 开始 对 状态 空间 进行 搜索 ,其 结 
也 是 一 棵 状态 搜索 树 。 解 决 本 问题 的 算法 关键 是 建立 状态 和 动作 的 数学 模型 ,并 找到 一 种 持续 驱 
动 动作 产生 的 搜索 方法 。 本 问题 并 不 复杂 ， 因 此 建立 数学 模型 的 工作 就 “退化 ”成 建立 描述 问题 
的 数据 结构 。 本 问题 的 状态 模型 不 仅 要 能 够 描述 静止 状态 ， 还 要 能 够 描述 并 记录 状态 转换 动作 ， 
尤其 是 对 状态 转换 的 描述 ， 因 为 这 会 影响 到 状态 树 搜索 算法 的 设计 。 除 此 之 外 ， 当 搜索 算法 找到 
一 个 最 终 状 态 时 , 需要 输出 从 开始 状态 到 最 终 状 态 的 动作 序列 , 这 也 需要 状态 模型 能 够 和 动作 模 
型 结合 在 一 起 。 下 面 一 起 来 看 看 本 问题 的 状态 模型 以 及 状态 树 的 设计 。 


\ 
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6.2.1 状态 的 数学 模型 与 状态 树 


观察 一 下 本 问题 的 状态 ， 看 起 来 好 像 是 3 个 和 尚 、3 个 妖怪 加 上 一 只 船 一 共 7 个 属性 ,但 是 
仔细 研究 就 会 发 现 ，3 个 和 尚之 间 和 3 个 妖怪 之 间 没 有 差异 ， 也 没有 顺序 关系 ， 因 此 在 考虑 数学 
模型 的 时 候 不 需要 赋予 它们 太 多 的 属性 , 只 要 用 数量 表示 它们 就 可 以 了 。 对 于 和 尚 和 妖怪 的 状态 ， 
分 别 用 两 个 值 表示 它们 在 河 两 岸 的 数量 , 这 样 只 需 4 个 属性 就 可 以 表示 ,分别 是 河 左 岸 和 尚 数 量 、 
河 左岸 妖怪 数量 、 河 对 岸 和 尚 数量 和 河 对 岸 妖怪 数量 。 每 当 有 妖怪 或 和 尚 随 船 的 移动 发 生变 化 时 ， 
只 需要 修改 和 尚 和 妖怪 在 河 两 岸 的 数量 即 可 完成 状态 的 转换 。 除 了 和 尚 和 妖怪 的 数量 , 还 有 一 个 
关键 因素 也 会 影响 到 状态 的 变化 , 那 就 是 小 船 的 位 置 。 小 船 的 位 置 是 个 非常 重要 的 状态 属性 , 不 
仅 决定 了 状态 的 差异 ， 还 会 影响 后 序 动作 的 选择 。 


最 后 的 状态 模型 中 ， 和 尚 与 妖怪 的 状态 就 是 数值 ， 船 有 两 个 枚 举 状态 ， 在 河 左岸 (LOCAL ) 
和 在 河 对 岸 (REMOTE )。 我 们 用 一 个 五 元 组 来 表示 某 个 时 刻 的 过 河 状 态 : [本 地 和 尚 数 ， 本 地 妖 
怪 数 ， 对 岸 和 尚 数 ， 对 岸 妖怪 数 ， 船 的 位 置 ]。 用 五 元 组 表示 的 初始 状态 就 是 [3, 3, 0, 0, LOCAL]， 
问题 解决 的 过 河 状 态 是 [0, 0, 3, 3, REMOTE]。 和 和尚、 妖怪 和 小 船 的 状态 模型 定义 的 数据 结构 如 下 
所 示 : 


struct ItemState 


{ 

int local monster; 

int local monk; 

int remote monster; 

int remote monk; 

BOAT_LOCATION boat; /*LOCAL or REMOTE*/ 
}; 


状态 模型 确定 以 后 ， 整 个 状态 空间 的 树 形 模型 也 就 确定 了 ， 读 者 可 以 参考 第 5 章 的 图 5-1 理 
解 一 下 本 问题 的 状态 树 。 接 下 来 就 要 确定 和 尚 与 妖怪 过 河 的 动作 模型 ,过 河 动作 是 驱动 状态 变化 
的 关键 。 


6.2.2 ”过 河 动作 的 数学 模型 


河 两 岸 的 和 尚 与 妖怪 的 数量 发 生变 化 的 直接 原因 是 小 船 的 位 置 关 系 发 生变 化 , 因为 船上 至 少 
要 有 一 个 和 尚 或 妖怪 ,所 以 只 要 船 的 位 置 发 生变 化 ,必然 会 引起 状态 的 变化 。 过 河 动作 是 促使 船 
的 位 置 发 生变 化 的 原因 ,也 是 连接 两 个 状态 的 转换 关系 。 这 个 转换 关系 包含 两 部 分 内 容 ,， 一 部 分 
是 船 的 位 置 变化 , 男 一 部 分 是 船上 的 妖怪 或 和 尚 的 数量 , 这 个 数量 会 引起 两 岸 的 和 尚 和 妖怪 的 数 
量 发 生变 化 。 

过 河 动 作 的 数学 模型 需要 明确 定义 两 个 内 容 , 即 动作 引起 船 的 位 置 变 化 情况 和 此 动作 移动 的 
和 尚 或 妖怪 的 数量 。 过 河 动作 的 具体 数据 结构 定义 如 下 : 


typedef struct tagActionEffection 
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ACTION NAME act; 
BOAT_LOCATION boat to; // 船 移动 的 方向 
int move_monster; // 此 次 移动 的 妖怪 数量 
int move_monk; // 此 次 移动 的 和 尚 数量 
}ACTION EFFECTION; 
ACTION_NAME 是 一 个 比较 有 意思 的 属性 ， 其 实 是 对 动作 的 一 个 命名 。“ 三 个 水 桶 等 分 8 升水 问 
题 ” 中 的 动作 是 通过 排列 组 合 三 个 水 桶 的 关系 产生 的 , 但 是 过 河 问 题 没有 这 个 条 件 , 这 也 是 同一 
类 问题 处 理 细节 上 的 差异 。 虽 然 不 能 通过 排列 组 合 产生 动作 , 但 是 通过 对 问题 的 观察 ,我 们 发 现 
过 河 问题 的 所 有 过 河 动 作 其 实 是 一 个 有 限 的 动作 集合 。 看 一 下 ACTION EFFECTION 的 定义 ， 根 据 题 
目的 要 求 ,无 论 船 是 从 左岸 到 对 岸 , 还 是 从 对 岸 返回 到 左岸 ,船上 装载 的 妖怪 和 和 尚 的 情况 只 能 
是 以 下 五 种 : 一 个 妖怪 、 一 个 和 尚 、 两 个 妖怪 、 两 个 和 尚 以 及 一 个 妖怪 加 一 个 和 尚 。 结 合 船 移动 
的 方向 ,一 共 只 有 10 种 过 河 动作 可 供 选 择 ， 分 别 是 : 
口 一 个 妖怪 过 河 
口 两 个 妖怪 过 河 
口 一 个 和 尚 过 河 
口 两 个 和 尚 过 河 
口 一 个 妖怪 和 一 个 和 尚 过 河 
口 一 个 妖怪 返回 
口 两 个 妖怪 返回 
口 一 个 和 尚 返回 
口 两 个 和 沿 返 回 
口 一 个 妖怪 和 一 个 和 尚 返 回 


于 是 ，ACTION NAME 的 定义 如 下 : 


typedef enum tagActionName 
ONE_MONSTER GO = 0， 
TWO_MONSTER_G0, 
ONE_MONK_00， 
TWO_MONK_00， 
ONE_MONSTER_ONE_MONK_00， 
ONE_MONSTER_BACK， 
TWO_MONSTER_BACK, 
ONE_MONK_BACK， 
TNO_MONK_BACK， 
ONE_MONSTER_ONE_MONK_BACK， 

VALID_ACTION_NAME， 
}ACTION_NAME ; 


请 注意 ， 如 果 ACTION_NAME 不 同 ， 其 对 应 的 boat to 、move monster 和 move _monk 三 个 属性 也 不 
相同 ,这 个 问题 有 10 种 不 同 的 动作 , 如 果 对 这 10 种 动作 不 能 用 一 个 抽象 的 记录 进行 一 致 性 处 理 ， 
那么 我 们 的 算法 代码 就 不 可 避免 地 出 现 长 长 的 if..else 语句 或 switch..case 语句 。 代 码 中 长 的 
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if.else 或 switch..case 语句 正 是 各 种 问题 的 起 源 ， 我 们 要 尽量 避免 出 现 这 种 情况 。 怎 么 做 一 致 性 
处 理 ? 这 是 算法 设计 中 常用 的 技巧 之 一 ,总 结 起 来 就 是 两 点 :首先 对 要 处 理 的 数据 进行 归纳 处 理 ， 
确定 共性 的 部 分 和 差异 的 部 分 ; 然后 对 差异 部 分 进行 量化 处 理 , 将 逻辑 的 差异 转化 成 计算 机 能 一 
致 性 处 理 的 差异 ， 比 如 数字 的 大 小 变化 、 字 符 串 的 长 短 变化 ,等 等 。 在 本 例 中 ,动作 名 称 和 人 小船 
的 位 置 是 共性 的 部 分 , 计算 机 已 经 不 用 区 分 动作 的 实际 类 型 就 可 以 进行 一 致 处 理 。 和 尚 和 妖怪 的 
移动 方法 随 动作 类 型 不 同 而 变化 , 无 法 统一 处 理 , 但 是 可 以 转化 成 数字 的 加 减法 处 理 。 举 个 例子 ， 
一 个 和 尚 和 一 个 妖怪 过 河 的 动作 , 实际 效果 就 是 河 左岸 的 和 尚 数量 和 妖怪 数量 各 减 一 , 河 对 岸 的 
和 尚 数量 和 妖怪 数量 各 加 一 。 整 理 起 来 ， 所 有 的 动作 可 归纳 为 以 下 动作 列表 : 


ACTION EFFECTION actEffect[] = 

{ 
{ ONE MONSTER G0 ， REMOTE，-1， 0 }, 
{ TWO MONSTER G0 ， REMOTE，-2， 0 }， 
{ ONE MONK GO ， REMOTE, 0, -1 }, 
{ TWO MONK GO ， REMOTE, 0, -2 }, 
{ ONE MONSTER ONE MONK GO ， REMOTE, -1, -1 }, 
{ ONE MONSTER BACK ， LOCAL ，1，0】， 
{ TWO MONSTER BACK ， LOCAL ，2，0】， 
{ ONE MONK_BACK ， LOCAL ，0，1)， 
{ TWO MONK BACK ， LOCAL ，0， 2 小 
{ ONE MONSTER ONE MONK BACK , LOCAL , 1, 1} 

}; 

列表 中 的 move_monster 属性 和 move_monk 属性 如 果 是 负数 ， 则 表示 是 从 本 地 移动 到 河 对 岸 。 


这 个 动作 列表 是 我 们 进行 状态 转换 一 致 性 处 理 的 基础 , 直接 使 用 这 张 表 就 不 需要 对 每 种 动作 都 进 
行 特殊 处 理 ， 可 以 避免 使 用 长 长 的 if.else 或 switch..case 语句 。 


6.3 ”搜索 算法 


本 童 介绍 的 算法 仍然 采用 深度 优先 遍历 算法 , 每 次 遍历 只 暂时 保存 当前 搜索 的 分 支 的 所 有 状 
态 , 之 前 搜索 过 的 分 支 上 的 状态 是 不 保存 的 ， 只 在 必要 的 时 候 输 出 结果 。 因 此 , 算法 不 需要 完整 
的 树 状 数据 结构 保存 整个 状态 树 ( 也 没有 必要 这 么 做 )， 只 需要 一 个 队列 能 暂时 存储 当前 搜索 分 
文 上 的 所 有 状态 即 可 。 这 个 队列 初始 时 只 有 一 个 初始 状态 ， 随 着 搜索 的 进行 逐步 增加 ， 当 搜索 算 
法 完成 后 ， 队 列 中 应 该 仍然 只 有 一 个 初始 状态 。 状 态 树 的 搜索 过 程 就 是 状态 树 的 生成 过 程 ， 因 此 


状态 树 一 开始 并 不 完整 ， 只 有 一 个 初始 状态 的 根 节 点 ， 当 搜索 ( 也 就 是 遍历 ) 操作 完成 时 ， 状 态 
树 才 完整 。 


一 个 静止 状态 结合 不 同 的 过 河 动 作 会 迁移 到 不 同 的 状态 。 上 一 节 已 经 分 析 过 了 , 每 个 状态 所 
能 采用 的 过 河 动作 只 能 是 ActionName 标识 的 10 种 动作 中 的 一 种 ( 当然 并 不 是 每 种 动作 都 适用 于 
此 状态 )， 有 了 这 个 动作 范围 ， 搜 索 状态 树 的 穷 举 算法 就 非常 简单 了 ， 只 需 将 当前 状态 分 别 与 这 
10 种 动作 进行 组 合 ， 就 可 以 得 到 状态 树 上 这 个 状态 所 有 可 能 的 新 状态 ， 对 新 状态 继续 应 用 各 种 
过 河 动作 ， 再 得 到 新 状态 ， 直 到 出 现 最 终 状 态 ， 得 到 一 个 过 河 过 程 。 图 6-2 就 是 一 个 过 河 结果 的 
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@ [3.3.0.0LOCAL] [3,1,0,2,REMOTE] | { [3,2,0,LLOCAL] | 
do/ 初 始 状态 do/ 两 个 妖怪 过 河 do/ 一 个 妖怪 回来 


[1,1,2,2,REMOTE] [3,1,0,2,LOCAL] [3,0,0,3,REMOTE] 
do/ 两 个 和 尚 过 河 do/ 一 个 妖怪 回来 do/ 两 个 妖怪 过 河 


[2,2,1,1,LOCAL] [0,2,1,3,REMOTE] | 
do/ 一 个 和 尚 和 一 个 妖怪 do/ 两 个 和 尚 过 河 


[3,0,0,3,LOCAL] 
do/ 一 个 妖怪 回来 


全- [0,0,3,3,REMOTE] [2,0,1,3,LOCAL] f [1,0,2,3,REMOTE] 
do/ 两 个 妖怪 过 河 do/ 一 个 妖怪 回来 | | do/ 两 个 妖怪 过 河 


图 6-2 一 个 过 河 结果 的 状态 转换 过 程 


6.3.1 状态 树 的 遍历 


状态 树 的 遍历 暗含 了 一 个 状态 生成 的 过 程 , 就 是 促使 状态 树 上 的 一 个 状态 向 下 一 个 状态 转换 
的 驱动 过 程 ， 这 是 一 个 很 重要 的 部 分 ， 如 果 不 能 正确 地 驱动 状态 变化 ,就 不 能 实现 状态 树 的 遍历 
(搜索 ) 建立 状态 模型 一 节 中 提 到 的 动作 模型 ， 就 是 驱动 状态 变化 的 关键 因子 。 算 法 的 动作 模型 
一 共 定义 了 10 种 动作 ， 每 种 动作 结合 当前 状态 就 可 以 产生 一 个 新 的 状态 ， 就 可 以 推动 状态 产生 
变化 。 当 然 ， 并 不 是 所 有 的 动作 都 能 适用 于 当前 状态 ， 比 如 ,假设 当前 状态 是 只 有 两 个 妖怪 在 河 
左岸 ， 则 “一 个 和 尚 过 河 "“ 两 个 和 尚 过 河 ” 和 “一 个 和 尚 和 一 个 妖怪 过 河 ”这 三 种 动作 就 不 适 
用 于 当前 状态 。 

状态 树 遍 历 的 关键 就 是 处 理 过 河 动作 列表 actEffect， 依 次 处 理 一 遍 这 个 列表 中 的 每 个 动作 
就 实现 了 状态 树 的 搜索 ， 因 为 使 用 了 表 结 构 ， 代 码 变 得 非常 简单 : 

/* 尝 试用 10 种 动作 分 别 与 当前 状态 组 合 */ 


for(int i = 0; i < sizeof(actEffect) / sizeof(actEffect[0]); i++) 


{ 


ProcessStateOnNewAction(states, current, actEffect[i]); 


} 
6.3.2 ”前 校 和 重复 状态 判断 

前 面 已 经 提 到 过 ,并 不 是 所 有 的 动作 都 适用 于 当前 状态 , 那么 , 如 何 判 断 一 个 动作 是 否 适用 
于 当前 状态 ? 首先， 当前 状态 中 船 的 位 置 很 关键 ,如果 船 的 位 置 在 河 对 岸 ， 那么 所 有 的 过 河 动作 


就 都 不 适用 。 其 次 是 移动 的 妖怪 或 和 尚 的 数量 是 否 与 当前 状态 相 适应 ， 比 如 6.3.1 节 给 出 的 例子 ， 
如 果 河 左岸 没有 和 尚 , 那么 所 有 需要 移动 和 尚 的 动作 就 都 不 适用 。 根 据 以 上 分 析 , 我 们 可 以 给 出 
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判断 动作 合法 性 的 算法 : 
bool ItemState::CanTakeAction(ACTION EFFECTION& ae) const 
{ 


if(boat == ae.boat to) 

return false; 

if((local monster + ae.move monster) < 0 

(local monster + ae.move monster) > monster count) 
return false; 

if((local monk + ae.move monk) < 0 

(local monk + ae.move monk) > monk_ count) 

return false; 


return true; 


} 

应 用 这 个 判断 , 可 以 省 去 很 多 不 必要 的 状态 变化 ,避免 出 现 一 些 不 符合 题目 要 求 的 错误 状态 ， 
比如 河 左 岸 有 -1 个 和 尚 ， 河 对 岸 有 4 个 和 尚 这 种 情况 。 

本 算法 采用 深度 优先 原则 搜索 状态 树 ， 就 会 遇 到 和 “三 个 水 桶 等 分 8 升水 问题 ”算法 一 样 的 
问题 , 那 就 是 重复 出 现 的 状态 会 导致 状态 环 路 。 比 如 某 一 时 刻 采 用 的 动作 是 “一 个 和 尚 和 一 个 妖 
怪 过 河 ”， 到 了 河 对 岸 形 成 新 的 状态 ， 如 果 新 状态 采用 的 动作 是 “一 个 和 尚 和 一 个 妖怪 返回 ”"， 则 
最 后 的 状态 就 变 成 了 过 河 之 前 的 状态 , 这 两 个 状态 加 上 这 两 个 动作 就 会 形成 状态 环 路 , 搜索 路 径 6 
上 存在 状态 环 路 的 后 果 就 是 搜索 算法 可 能 会 陷入 死 循环 。 除 此 之 外 ,如果 对 一 个 状态 树 分 支 上 的 
某 个 状态 经 过 搜索 ， 其 结果 已 经 知道 ， 则 在 男 一 个 状态 树 分 支 上 搜索 时 再 遇 到 这 个 状态 时 ,可 以 
直接 给 出 结果 , 或 跳 过 搜索 ,以便 提 高 搜索 算法 的 效率 。 在 这 个 过 程 中 因 重 复出 现 被 放弃 或 跳 过 
的 状态 ， 可 以 理解 为 另 一 种 形式 的 “ 剪 枝 ”， 可 以 使 一 次 深度 优先 遍历 很 快 收敛 到 初始 状态 。 

本 算法 依然 采用 双 端 队列 来 组 织 搜索 过 程 中 的 已 处 理 状态 , 相关 的 判断 算法 和 “三 个 水 桶 等 
分 8 升水 问题 ”的 算法 完全 一 样 。 


6.4 算法 实现 

算法 的 核心 依然 是 递归 搜索 , 从 初始 状态 开始 调用 Searchstate() 函 数 。 函 数 每 次 从 状态 队列 
尾部 取出 当前 要 处 理 的 状态 ,首先 判断 是 否 是 最 终 的 过 河 状态 ， 如 果 是 则 输出 一 组 过 河 方案 ， 如 
果 不 是 ， 则 尝试 用 动作 列表 中 的 动作 与 当前 状态 结合 ， 看 看 是 否 能 生成 合法 的 新 状态 。 


void SearchState(std::deque<ItemState>& states) 


ItemState current = states.back(); /* 每 次 都 从 当前 状态 开始 */ 
if(current.IsFinalState()) 


{ 
printResult(states); 


return; 


} 


/* 尝 试用 10 种 动作 分 别 与 当前 状态 组 合 */ 
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for(int i = 0; i < sizeof(actEffect) / sizeof(actEffect[0]); i++) 
{ 


} 


SearchStateOnNewAction(states, current, actEffect[i]); 


} 
搜索 的 递归 关系 是 通过 searchstateOnNewAction() 函 数 体 现 的 ,这 个 函数 首先 判断 当前 状态 和 
制定 的 过 河 动作 是 否 能 生成 一 个 新 状态 , 如 果 能 得 到 一 个 合法 的 新 状态 , 则 继续 处 理 这 个 新 状态 。 


void SearchStateOnNewAction(std::deque<ItemState>& states， 


ItemState& current, ACTION EFFECTION& ae) 
{ 
ItemState next; 
if(MakeActionNewState(current, ae, next)) 
{ 
if(next.IsValidState() 8&8& !IsProcessedState(states, next)) 
{ 
states.push back(next); 
SearchStatel(states); 
states.pop back(); 
上 
} 
} 


MakeActionNewstate() 函 数 是 一 个 很 有 意思 的 函数 , 它 就 是 这 个 算法 设计 的 通过 过 河 动 作 属性 
列表 对 所 有 动作 进行 一 致 性 处 理 的 体现 ， 通 过 对 属性 的 直接 加 或 减 计算 ， 避免 了 长 if..else 语句 
或 switch..case 代码 。 


bool MakeActionNewState(const Itemstate& curState, ACTION EFFECTION& ae, ItemState®& newState) 
{ 


if(curState.CanTakeAction(ae)) 


{ 
newState = curState; 
newState.1local monster += ae.move monster; 
newState.1local monk += ae.move monk; 
newState.remote monster -= ae.move monster,; 
newState.remote monk -= ae.move monk; 
newState.boat = ae.boat to; 
newState.curAct = ae.act; 
return true; 

] 


return false; 


6.5 总 结 


最 后 , 这 个 算法 告诉 我 们 一 共有 四 种 过 河 方案 。 大 多 数 人 都 能 很 容易 地 给 出 本 章 开始 时 给 出 
的 方案 ， 这 个 应 该 是 最 容易 想到 的 。 事 实 上 ， 和 过 有 人 给 出 其 他 方案 ,所 以 我 知道 这 个 问题 
可 能 不 止 ” 种 解决 方案 。 现 在 ， 我 们 知道 了 ， 这 个 问题 一 共有 四 种 解决 方案 ， 并 且 只 有 四 种 。 
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第 章 


往 定 匹配 导 舞 伴 问题 


每 年 凤凰 花 开 、 蝉 鸣 绿 叶 的 季节 ， 都 是 毕业 的 季节 ， 也 是 同学 们 找 工 作 的 季节 。 很 显然 ,学 
生 和 雇主 之 间 从 来 都 是 双向 选择 的 关系 ， 然 而 学 霸 们 往往 先 人 一 步 ， 早 早 地 就 抓 了 一 把 offer。 
无 奈 ， 即 便 是 学 霸 也 分 身 无 术 ， 最 终 只 能 选择 一 个 offer。 毫 无 疑问 ， 学 霸 们 会 根据 自己 的 偏好 
对 offer 排队 ， 选 其 中 最 好 的 一 个 。 有 时 候 我 会 想 ， 其 他 也 给 了 学 霸 offer 的 公司 岂 不 是 少 了 一 个 
名 额 ? 显然 我 是 多 虑 了 ， 其 实 这 些 雇主 公司 也 有 一 个 偏好 列表 作为 备用 ,如果 空 出 了 名 额 ,他 们 
会 从 这 个 备用 的 偏好 队列 中 再 选 一 个 。 但 这 总 归 不 是 一 个 最 高 效 的 资源 配置 方式 , 大 量 的 撤销 和 
重新 选择 会 浪费 很 多 社会 资源 。 有 没有 一 种 方法 ,在 双 癌 选择 公开 透明 的 基础 上 , 按照 资源 配置 
的 最 优 原则 给 学 生 和 雇主 配对 ， 直 接 得 到 一 个 学 生 和 雇主 之 间 的 完备 匹配 或 稳定 匹配 ? 

幸运 的 是 ， 确 实 有 人 在 研究 稳定 匹配 问题 (stable matching problem )。 戴 维 : 盖 尔 (David Gale ) 
和 劳 埃 德 . 沙 普 利 ( Lloyd Shapley ) 就 是 两 位 这 样 的 专家 ， 他 们 从 20 世纪 60 年 代 就 开始 研究 这 
个 问题 。 他 们 最 早 人 研究 的 问题 是 稳定 婚姻 问题 ( stable marriage problem )， 其 实 这 适用 于 所 有 带 
局 爱 或 优先 选择 的 双向 选择 问题 。 本 章 我 们 就 以 稳定 婚姻 问题 为 例 , 介绍 一 下 盖 尔 和 沙 普 利 研究 
的 稳定 匹配 算法 (Gale-Shapley 算法 ) 的 原理 ， 并 给 出 一 个 解决 舞伴 匹配 问题 的 Gale-Shapley 算 
法 实现 。 


7.1 稳定 匹配 问题 


1962 年 ， 盖 尔 和 沙 普 利 发 表 了 一 篇 名 为 “大 学 招生 与 婚姻 的 稳定 性 ”中 的 论文 ， 首次 提出 了 
稳定 婚姻 问题 , 该 问题 后 来 成 为 研究 稳定 匹配 的 典型 例子 。 在 介绍 稳定 匹配 问题 之 前 , 我 们 先 来 
了 解 几 个 概念 。 


7.1.1 什么 是 稳定 匹配 


假设 个 未 婚 男 人 的 集合 M={m,m2…,mw} 和 nn 个 未 婚 女 人 的 集合 fi,w2…sww} , 令 MX 到 
为 所 有 可 能 的 形 如 (mw 的 有 序 对 的 集合 ， 其 中 mE M，wiE 下 。 根 据 上 述 定 义 ， 我 们 给 出 匹配 
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的 概念 ， 匹 配 S 是 来 自 WMx 丈 的 有 序 对 的 集合 ， 并 且 具 有 以 下 性 质 : 每 个 M 的 成 员 和 每 个 球 的 
成 员 至 多 出 现在 $ 的 一 个 有 序 对 中 。 接 下 来 是 完美 匹配 的 概念 ， 完美 匹配 5 是 一 个 具有 以 下 性 质 
的 匹配 : M 的 每 个 成 员 和 球 的 每 个 成 员 恰好 出 现在 8 的 一 个 对 里 。S 和 $ 这 两 个 定义 的 差别 就 是 
“至 多 ”和 “恰好 ”两 个 词 ， 对 很 多 人 来 说 ， 区 分 这 两 个 概念 就 像 区 分 落 基 山大 角 羊 和 沙漠 大 角 
羊 一 样 困 难 。 我 来 解释 一 下 ,可 以 将 8 理解 为 M 和 丈 的 成 员 配 对 结婚 , 但 是 M 和 丈 中 不 一 定 所 
有 成 员 都 能 配对 成 功 ， 还 有 剩余 的 男人 和 女人 是 单身 。 而 完美 匹配 9 则 是 8 的 一 种 特殊 情况 ， 即 
5S' 是 所 有 人 都 配对 成 功 ， 不 存在 落 单 的 男人 和 女人 。 

很 显然 , 盖 尔 和 沙 普 利 研 究 的 稳定 婚姻 问题 是 在 一 夫 一 妻 制 度 下 男人 和 女人 的 配对 关系 ,每 
个 男人 最 终 都 要 和 一 个 女人 结婚 。 现在 在 完美 匹配 的 背景 FF 引入 优先 或 偏好 的 概念 , 每 个 男人 都 
按照 个 人 喜好 对 所 有 女人 排名 ， 如 果菜 个 男人 m 给 女人 w 的 排名 高 于 给 w 的 排名 ， 就 可 以 理解 
为 mm 喜欢 w 胜 过 w'。 反 过 来 也 一 样 ， 每 个 女人 也 按照 自己 的 喜好 对 所 有 的 男人 排名 。 以 上 排名 


必须 区 分 先后 顺序 ， 不 能 有 排名 并 列 的 情况 出 现 。 那 么 什么 是 稳 
定 匹 配 呢 ?稳定 匹配 就 是 在 引入 优先 排名 的 情况 下 , 一 个 完美 匹 (")—() 
配 5 如果 不 存在 不 稳定 因素 ， 则 称 这 个 完美 匹配 是 稳定 匹配 。 什 : 

么 是 不 稳定 因素 呢 ? 假 设 在 完美 匹配 5 中 存在 两 个 配对 (m, w ) 六 


和 (za, w'),， 但 是 从 优先 排名 上 看 ，m 更 喜欢 w' 而 不 喜欢 w， 同 (=) C») 
时 w' 也 更 喜欢 m 而 不 喜欢 m'， 如 图 7-1 所 示 。 在 这 种 情况 下 , 我 
们 称 这 个 完美 匹配 5S 是 不 稳定 的 , 像 (m,w') 这 样 有 “私奔 ” 倾 图 7-1 不 稳定 因素 示意 
向 的 不 稳定 对 ( unstable pair ) 就 是 5 的 一 个 不 稳定 因素 。 

稳定 匹配 满足 两 个 条 件 : 首先 ， 它 是 一 个 完美 匹配 ; 其 次 ， 它 不 含有 任何 不 稳定 因素 。 在 给 
定 的 众多 复杂 关系 中 ， 如 何 求 得 一 个 稳定 匹配 ? 盖 尔 和 沙 普 利 在 1962 年 提出 的 Gale-Shapley 算 
法 就 是 一 种 著名 的 稳定 匹配 算法 ， 接 下 来 我 们 就 来 简单 介绍 一 下 Gale-Shapley 算法 的 原理 。 


Ea 


7.1.2 Gale-Shapley 算法 原理 


盖 尔 和 沙 普 利 的 策略 是 一 种 寻找 稳定 婚姻 的 策略 , 不 管 男女 之 间 有 何 种 偏好 ,这 种 策略 总 可 
以 得 到 一 个 稳定 的 婚姻 匹配 。 先 来 看 一 下 Gale-Shapley 算法 实现 的 伪 代 码 : 


初始 化 所 有 的 me M, we W， 所 有 的 m 和 w 都 是 自由 状态 ; 
while (存在 男人 是 自由 的 ， 并 且 他 还 没有 对 每 个 女人 都 求 过 婚 ) 
{ 


选择 一 个 这 样 的 男人 mj 
W = ml 的 优先 选择 表 中 还 没有 求 过 婚 的 排名 最 高 的 女人 ; 
if (w 是 自由 状态 ) 
将 (m，w) 的 状态 设置 为 约会 状态 ; 
: 
else /*W 已 经 和 其 他 男人 约会 了 */ 
{ 


m= W 当前 约会 的 男人 ; 
if (w 更 喜爱 m' 而 不 是 由 
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m 保持 单身 状态 (Ww 不 更 换 约 会 对 象 ) ; 


else /*W 更 喜爱 m 而 不 是 m'*/ 
{ 
将 (m，wW) 的 状态 设置 为 约会 状态 ; 
将 m 设置 为 自由 状态 ; 
} 
} 


a 已 经 匹配 的 集合 5; 

看 起 来 总 是 男人 主动 选择 ,女人 被 动 接受 , 事实 上 这 个 算法 并 没有 做 这 个 假设 。 基 于 男女 平 
等 的 原则 , 也 可 以 是 女人 主动 选择 , 男人 被 动 接受 , 这 就 是 这 个 算法 常 被 提 到 的 两 个 策略 , 即 “ 男 
士 优先 ”还 是 “女士 优 先 ”。 

从 Gale-Shapley 算法 的 策略 来 看 ， 男 人 们 一 轮 一 轮 地 选择 自己 中 意 的 女人 , 女人 则 可 以 选择 
接受 追求 者 ， 或 拒绝 追求 者 。 只 要 女人 是 单身 的 自由 状态 ， 男 人 的 追求 就 不 会 被 拒绝 ,但 这 并 不 
表示 男人 总 是 能 选 到 自己 最 中 意 的 女人 ,因为 女人 是 可 以 毁约 的 。 男人 被 拒绝 的 情况 有 两 种 ,一 
种 情况 是 男人 追求 的 女人 已 经 有 约会 对 象 ， 并 且 女 人 喜欢 自己 的 约会 对 象 胜 过 当前 追求 她 的 男 
人 ; 另 一 种 情况 是 女人 面 对 另 一 个 男人 的 追求 时 ,如 果 她 喜欢 这 个 追求 她 的 男人 胜 过 自己 当前 的 
约会 对 象 , 女人 会 利用 毁约 的 权利 拒绝 当前 约会 对 象 。 男 人 每 被 拒绝 一 次 ， 就 只 能 从 自己 的 优先 
选择 表 中 选择 下 一 个 女人 。 男 人 不 能 重复 尝试 约会 那些 已 经 拒绝 过 他 的 女人 , 因此 这 种 选择 总 是 
无 奈 地 向 越 来 越 不 中 意 的 方向 发 展 。 每 一 轮 选 择 之 后 都 会 有 一 些 男人 或 女人 脱离 单身 的 自由 状 
态 ， 当 某 一 轮 过 后 没有 任何 一 个 男人 或 女人 是 单身 状态 时 ， 这 个 算法 就 结束 了 。 在 Gale-Shapley 
算法 中 ,nn 个 男人 共和 需要 进行 n 轮 选 择 ， 每 一 个 男人 需要 向 个 中 意 对 象 求婚 ， 因 此 ， 算 法 最 多 
需要 n*n 轮 循环 就 可 以 结束 。 

这 个 算法 的 流程 非常 简单 , 但 是 是 否 有 效 呢 ? 也 就 是 说 Gale-Shapley 算法 结束 后 得 到 的 一 个 
匹配 一 定 是 稳定 匹配 吗 ? 还 记得 上 一 节 介 绍 的 稳定 匹配 的 两 个 条 件 吗 ”稳定 匹配 首先 是 完美 匹 
配 , 其 次 是 要 求 没 有 不 稳定 因素 。 下 面 我 们 就 从 这 两 方面 分 别 证 明 一 下 这 个 算法 的 结果 是 否 是 稳 
定 匹 配 。 

首先 , 我 们 要 证 明 Gale-Shapley 算法 结束 得 到 的 是 一 个 完美 匹配 。 直 接 证 明 这 个 问题 比较 困 
难 ， 所 以 我 们 采用 反 证 法 。 假 设 算法 结束 后 有 一 个 男人 m 还 是 单身 ， 因 为 规则 是 一 个 男人 只 能 
和 一 个 女人 约会 , 这 就 意味 着 必定 有 一 个 女人 w 也 是 单身 。 根 据 算法 规则 ,女人 只 要 是 单身 , 一 
定 会 接受 男人 的 求婚 ， 现 在 w 是 单身 ,说 明 w 没有 收 到 任何 求婚 请 求 。 这 时 就 出 现 矛 盾 了 ， 
为 根据 算法 流程 ，m 肯定 是 向 包括 w 在 内 的 所 有 女人 都 求 过 婚 的 ， 所 以 假设 应 该 是 不 成 立 的 , 也 
就 是 说 ， 能 够 证 明 Gale-Shapley 算法 得 到 的 是 一 个 完美 匹配 。 

接 下 来 证 明 Gale-Shapley 算法 的 结果 没有 任何 不 稳定 因素 ， 仍 然 采 用 反 证 法 。 假 设 匹 配 结 
果 中 存在 不 稳定 因素 ,也 就 是 说 ,存在 m 和 w， 他 们 各 自 都 已 经 有 了 伴侣, 但 是 m 襄 欢 w 胜 过 
喜欢 自己 现在 的 伴侣 ， 同 样 ，w 也 喜欢 m 胜 过 喜欢 自己 现在 的 伴侣 。 但 是 根据 算法 规则 ，m 肯 
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定 是 向 w 求 过 婚 的 ， 如 果 w 更 喜欢 m，w 应 该 选择 m 而 不 是 当前 的 伴侣 ， 因 此 这 个 假设 也 是 不 
成 立 的 。 

由 以 上 证 明 可 知 ，Gale-Shapley 算法 的 结果 是 一 个 稳定 匹配 ， 也 就 证 明了 Gale-Shapley 算法 
的 正确 性 。 


7.2 Gale-Shapley 算法 的 应 用 实例 


本 节 利 用 舞伴 问题 介绍 一 个 Gale-Shapley 算法 的 应 用 实例 。 舞 伴 问题 是 这 样 的 : 有 nn 个 男孩 
与 n 个 女孩 参加 有 舞会 ,每 个 男孩 和 女 孩 均 交 给 主持 一 个 名 单 ， 写 上 他 (她 ) 中 意 的 舞伴 名 字 。 无 
论 男孩 还 是 女孩 , 提交 给 主持 人 的 名 单 都 是 按照 偏爱 程度 排序 的 , 排 在 前 面 的 都 是 他 们 最 中 意 的 
舞伴 。 试 问 主持 人 在 收 到 名 单 后 ,是否 可 以 将 他 们 分 成 闻 对 ,使 每 个 人 都 能 和 他 们 中 意 的 舞伴 结 
对 跳舞 ?为 了 避免 舞会 上 出 现 不 和 谐 的 情况 ， 要求 这 些 舞 伴 的 关系 是 稳定 的 。 

假如 有 两 对 分 好 的 舞伴 :( 男孩 4， 女孩 如 ) 和 ( 男孩， 女孩 4), 但 是 男孩 4 更 偏爱 女孩 
4， 女孩 4 也 更 偏爱 男孩 4， 同样 ,女孩 B 更 偏爱 男孩 B， 而 男孩 有 也 更 偏爱 女 爱 B。 在 这 种 情 
况 下 ， 这 两 对 舞伴 就 倾向 于 分 开 ， 然后 重新 组 合 ， 这 就 是 不 稳定 因素 。 很 显然 ,， 这 个 问题 需要 的 
是 一 个 稳定 匹配 的 结果 ， 适 合 使 用 Gale-Shapley 算法 。 


7.2.1 算法 实现 


首先 定义 舞伴 的 数据 结构 , 根据 题 意 , 一 个 舞伴 至 少 要 包含 两 个 属性 ,就 是 每 个 人 的 偏爱 舞 
伴 列表 和 他 (她 ) 们 当前 选择 的 有 舞伴。 根据 Gale-Shapley 算法 的 规则 ， 还 需要 有 一 个 属性 表示 下 
一 次 要 向 哪个 偏爱 舞伴 提出 跳舞 要 求 。 当然 , 这 个 属性 并 不 是 男生 和 女生 同时 需要 的 , 当 使 用 “ 男 
士 优先 ”策略 时 ,男生 需要 这 个 属性 ， 当 使 用 “女士 优先 ”策略 时 ,女生 需要 这 个 属性 。 为 了 使 
程序 输出 更 有 趣味 ， 需 要 为 每 个 角色 提供 一 个 名 字 。 综 上 所 述 ， 舞 伴 的 数据 结构 定义 如 下 : 


typedef struct tagPartner 


char *name; ”// 名 字 

int next; // 下 一 个 邀请 对 象 

int current;  // 当 前 舞伴 ，-1 表 示 还 没有 舞伴 
int pCount; ， // 偏 爱 列 表 中 舞伴 个 数 

int perfect[UNIT COUNT]; // 偏 爱 列表 
}PARTNER; 


UNIT_COUNT 是 男孩 或 女孩 的 数量 ( 稳定 匹配 问题 总 是 假设 男孩 和 女孩 的 数量 相等 )，pCount 是 
嵩 爱 列表 中 的 舞伴 个 数 。 根 据 标准 的 “稳定 婚姻 问题 ”的 要 求 ，pCount 的 值 应 该 是 和 UNIT_COUNT 
一 致 的 , 但 是 某 些 情况 下 ( 比如 一 些 算法 比赛 题目 的 特殊 要 求 ) 也 会 要 求 伙伴 们 提供 的 偏爱 列表 
可 长 可 短 ， 因 此 我 们 增加 了 这 个 属性 。 但 是 有 一 点 需要 注意 ， 如 果 人 允许 舞伴 的 pCount 小 于 
UNIT_ COUNT， 则 7.1.2 节 的 证 明 就 不 适用 了 , 需要 设置 相应 的 条 件 并 使 用 更 复杂 的 证 明 方法 。 关 键 
是 , 最 后 不 一 定 能 得 到 稳定 匹配 的 结果 。 这 里 给 出 的 实现 算法 使 用 数组 来 存储 参加 舞会 的 男孩 和 
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女孩 列表 ,因此 这 个 数据 结构 中 的 next、current 和 perfect 列表 中 存放 的 都 是 数组 索引 ， 了 解 这 
一 点 有 助 于 理解 算法 的 实现 代码 。 

Gale-Shapley 算法 的 实现 非常 简单 ,将 7.1.2 节 给 出 算法 伪 代 码 翻译 成 编程 语言 即 可 。 完 整 的 
算法 代码 如 下 : 


bool Gale Shapley(PARTNER *boys, PARTNER *girls, int count) 
{ 


int bid = FindFreePartner(boys, count); 
while(bid >= 0) 
{ 
int gid = boys[bid].perfect[boys[bid].next]; 
if(girls[gid].current == -1) 


boys[bid].current = gid; 
girls[gid].current = bid; 
} 
else 
{ 
int bpid = girls[gid].current; 
// 女 孩 喜 欢 bid 胜 过 其 当前 舞伴 bpid 
if(GetPerfectPosition(&girls[gid], bpid) > GetPerfectPosition(&girls[gid], bid)) 
{ 
boys[bpid].current = -1; // 当 前 舞伴 恢复 自由 身 
boys[bid].current = gid; // 结 交 新 舞伴 
girls[gid].current = bid; 


} 
boys[bid].next++; // 无 论 是 否 配对 成 功 ， 对 同一 个 女孩 只 邀请 一 次 
bid = FindFreePartner(boys，count); 


} 


return IsAllPartnerMatch(boys, count); 


} 

FindFreePartner() 消 数 负责 从 男孩 列表 中 找 一 个 还 没有 有 舞 伴 、 并 且 偏 好 列表 中 还 有 没有 邀请 
过 的 女孩 的 男孩 , 返回 男孩 在 列表 (数组 ) 中 的 索引 。 如 果 返 回 值 等 于 -1， 表 示 没 有 符合 条 件 的 
男孩 了 ,于 是 主 循环 停止 ,算法 就 结束 了 。Gaetperfectposition() 函 数 用 于 判断 女孩 喜欢 一 个 舞伴 
的 程度 ， 通 过 返回 舞伴 在 自己 的 偏爱 列表 中 的 位 置 来 判断 ， 位 置 越 靠 前 ， 也 就 是 
GetpPerfectPosition() 函 数 的 返回 值 越 小 , 说 明 女 孩 越 喜欢 这 个 舞伴 。GetperfectpPosition() 函 数 的 
实现 代码 如 下 : 


int GetPerfectPosition(PARTNER *partner, int id) 
{ 


for(int i = 0; i «< partner->pCount; i++) 
{ 

if(partner->perfect[i] == id) 

{ 


return i; 
t 
be 
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// 返 回 一 个 非常 大 的 值 ， 意 味 着 根本 排 不 上 对 
return Ox7FFFFFFF; 
} 


按照 “稳定 婚姻 问题 ”的 要 求 ， 这 个 函数 应 该 总 是 能 够 得 到 ID 指定 的 异性 舞伴 在 partner 
的 偏爱 列表 中 的 位 置 ， 因 为 每 个 partner 的 偏爱 列表 包含 所 有 异性 舞伴 。 但 是 当 题 目 有 特殊 需求 
时 ，partner 的 偏爱 列表 可 能 只 有 部 分 异性 舞伴 。 比 如 partner 非常 恨 一 个 人 ,他们 绝对 不 能 成 为 
舞伴 , 那么 partner 的 偏爱 列表 肯定 不 会 包含 这 个 人 。 考虑 到 算法 的 通用 性 , GetPerfectPosition() 
函数 默认 返回 一 个 非常 大 的 数 ,返回 这 个 数 这 意味 着 ID 指定 的 异性 舞伴 在 partner 的 偏爱 列表 中 
根本 没有 位 置 ( 非常 恨 ), 根据 算法 的 规则 , partner 最 不 喜欢 的 异性 舞伴 的 位 置 都 比 id 指定 的 异 
性 舞伴 位 置 靠 前 。 这 也 是 算法 一 致 性 处 理 的 一 个 技巧 ,GetpPerfectpPosition() 函 数 当然 可 以 设计 成 
返回 -1 表示 ID 指定 的 异性 舞伴 不 在 partner 的 偏爱 列表 中 ， 但 是 大 家 想 一 想 ， 算 法 中 是 不 是 要 
这 个 返回 值 做 特殊 处 理 ? 原 来 代码 中 判断 位 置 关 系 的 一 行 代码 处 理 ; 
if(GetPperfectPosition(&girls[gid], bpid) > GetPperfectPosition(&girls[gid], bid)) 
无 会 变 得 非常 繁琐 ， 让 我 们 看 看 会 是 什么 情况 : 

if((GetPperfectPosition(&girls[gid], bpid) == -1) 

&& (GetPperfectPposition(8&girls[gid], bid) == -1)) 


> 


at 


// 当 前 舞伴 bpid 和 bid 都 不 在 女孩 的 喜欢 列表 中 ， 太 糟糕 了 


} 
else if(GetPperfectPosition(&girls[gid], bpid) == -1) 


// 当 前 舞伴 bpid 不 在 女孩 的 喜欢 列表 中 ，bid 有 机 会 


else if(GetPerfectPosition(&girls[gid], bid) == -1) 


//bid 不 在 女孩 的 喜欢 列表 中 ， 当 前 舞伴 bpid 维持 原状 


} 
else if(GetPerfectPosition(&girls[gid], bpid) > GetPerfectPosition(&girls[gid], bid)) 
// 女 孩 喜欢 bid 胜 过 其 当前 舞伴 bpid 


} 


else 
// 女 孩 喜欢 当前 舞伴 bpid 胜 过 bid 
on 
这 是 我 最 不 喜欢 的 代码 逻辑 , 真 的 ， 太 精 糕 了 。 可 见 ， 这 个 小 小 的 技巧 为 代码 的 逻辑 处 理 带 
来 了 极 大 的 好 处 。 类 似 的 技巧 被 广泛 应 用 ,在 排序 算法 中 经 常 使 用 “哨兵 ”位 ， 避 人 免 每 次 都 要 判 
断 是 否 比较 完全 部 元 素 。 面 向 对 象 技 术 中 常用 的 “Dummy Object” 技 术 ， 也 是 类 似 的 思想 。 
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Gale-Shapley 算法 原来 如 此 简单 ， 你 是 不 是 为 沙 普 利 能 获得 诺 贝尔 奖 愤愤 不 平 ” 其 实 不 然 ， 
算法 原理 的 简单 并 不 等 于 其 解决 的 问题 也 简单 ， 本 书 介 绍 的 很 多 算法 都 是 如 此 ， 小 算法 解决 大 


问题 。 


7.2.2 ”改进 优化 : 空间 换 时 间 


Gale Shapley() 函 数 给 出 的 算法 还 有 点 问题 ， 主 要 是 GetpPerfectPosition() 孙 数 的 策略 ， 这 个 
函数 每 次 都 要 遍历 partner 的 偏爱 舞伴 列表 才能 确定 bid 的 位 置 , 很 可 能 导致 理论 上 时 间 复 杂 度 为 
O(n ) 的 算法 在 实际 实现 时 变 成 O05) 的 时 间 复 杂 度 。 为 了 避免 算法 在 多 轮 选 择 过 程 中 频繁 遍历 每 
个 partner 的 偏爱 舞伴 列表 ， 需 要 对 partner 到 底 更 偏爱 哪个 舞伴 的 判断 策略 进行 改进 。 

改进 的 原则 就 是 “以 空间 换 时 间 ”。 简 单 来 讲 ， 以 空间 换 时 间 的 方法 就 是 用 一 张 事先 初 始 化 
好 的 表 存 储 这 些 位 置 关系 , 在 使 用 个 过 程 中 , 以 0(1) 时 间 复 杂 度 的 方式 直接 查 表 确定 偏爱 舞伴 的 
关系 。 这 样 的 表 可 以 是 线性 表 , 也 可 以 是 喻 希 表 这 样 的 映射 表 。 对 于 这 个 问题 , 我 们 选择 使 用 二 
维 表 来 存储 这 些 位 置 关 系 。 假设 存在 二 维 表 priority[n][n]， 我 们 用 priority[w][m] 表 示 m 在 w 的 偏 
爱 列表 中 的 位 置 ， 这 个 值 越 小 ， 表 示 m 在 w 的 偏爱 列表 中 的 位 置 越 靠 前 。 在 算法 开始 之 前 ， 首 
先 初始 化 这 个 关系 表 : 

for(int w = 0; w < UNIT COUNT; w++) 

{ 


// 初 始 化 成 最 大 值 ， 原 理 同上 
for(int j = 0; j < UNIT_COUNT; j++) 
{ 

priority[w][j] = Ox7FFFFFFF; 


// 给 偏爱 舞伴 指定 位 置 关系 
int pos = 0; 
for(int m = 0; m < girls[w].pCount; m++) 
; priority[w][girls[w].perfect[m]] = pos++; 
} 
最 后 ， 将 对 GetpPerfectPosition() 国 数 的 调用 替换 成 查 表 : 
if(priority[gid][bpid] > priority[gid][bid]) 
对 于 一 些 在 算法 执行 过 程 中 不 会 发 生变 化 的 静态 数据 , 如 果 算 法 执行 过 程 中 需要 反复 读 取 这 
些 数据 ， 并 且 读 取 操 作 存在 一 定时 间 开 销 的 场合 ， 比 较 适 合 使 用 这 种 “以 空间 换 时 间 ” 的 策略 。 
用 合理 的 方式 组 织 这 些 数据 , 使 得 数据 能 够 在 0(1) 时 间 复 杂 度 内 实现 是 这 种 策略 的 关键 。 对 本 问 
题 应 用 “以 空间 换 时 间 ” 的 策略 ,需要 在 算法 开始 的 准备 阶段 初始 化 好 priority 二 维 表 ， 这 需要 
一 些 人 额外 的 开销 ， 但 是 相对 于 rw 次 查询 节省 的 时 间 来 说 ， 这 点 开销 是 能 够 容忍 的 。 
“以 空间 换 时 间 ” 也 是 算法 设计 常用 的 技巧 ,在 很 多 算法 中 都 有 应 用 。 比 如 本 书 第 15 章 介绍 
的 快速 傅 里 叶 变换 算法 ,经 过 蝶 形 变换 后 每 个 点 的 数据 位 置 都 发 生 了 变化 ,需要 将 这 些 点 的 位 置 
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还 原 。 可 以 利用 一 个 二 重 循环 将 这 些 错 位 的 数据 还 原 ， 也 可 以 利用 网 形变 换 的 位 置 变换 关系 表 ， 
采用 查 表 的 方式 将 两 个 错位 的 数据 交换 位 置 ， 后 者 采用 的 就 是 “以 空间 换 时 间 ” 的 策略 。 


7.3 有 多 少 稳定 匹配 


当 参 加 舞会 的 男孩 和 女孩 按照 一 定 的 顺序 排 好 队 , 位 置 固定 之 后 , 使 用 Gale-Shapley 算法 能 
够 得 到 一 个 确定 的 稳定 匹配 结果 。 但 是 对 这 和 群 男孩 和 女孩 来 说 , 稳定 匹配 的 结果 肯定 不 是 唯一 的 ， 
其 实 只 要 将 计算 策略 从 “男士 优先 ”转换 成 “女士 优先 ”， 就 可 以 得 到 另外 一 个 完全 不 同 的 稳定 
匹配 结果 。 同 样 ， 调 整 一 下 男孩 们 的 位 置 顺序 ， 比 如 让 最 后 一 个 男孩 排 在 第 一 的 位 置 ,让 他 第 一 
个 邀请 女孩 ， 则 Gale-Shapley 算法 也 可 以 得 到 一 个 完全 不 同 的 稳定 匹配 结果 。 


很 显然 ,对 于 任意 情况 下 的 n 个 男孩 入 个 女孩 来 说 ,肯定 有 多 个 稳定 匹配 ,那么 ,到底 有 
多 少 个 稳定 匹配 ? 稳定 匹配 首先 必须 是 完美 匹配 ,而 且 稳定 匹配 的 个 数 小 于 或 等 于 完美 匹配 , 所 
以 ,我们 可 以 先 从 理论 上 计算 一 下 完美 匹配 的 数量 ， 佑 算 一 下 问题 的 规模 ， 然 后 再 决定 是 否 能 
算法 找 出 全 部 的 稳定 匹配 。 从 理论 上 分 析 ， 只 要 每 个 人 的 偏爱 列表 都 包含 全 部 异性 舞伴 , 那么 完 
美 匹 配 的 个 数 就 可 以 通过 公式 计算 出 来 。 首 先 ,假设 男孩 们 已 经 排 好 了 队 ,， 准备 按照 顺序 邀请 女 
孩 跳舞 ， 在 不 考虑 稳定 匹配 的 情况 下 ,每 个 男孩 选择 一 个 女孩 之 后 , 还 没有 舞伴 的 女孩 的 总 数 就 
减 1, 剩 下 的 男生 的 可 选 范围 就 变 小 了 。 第 一 个 男孩 选择 的 可 能 情况 是 C, ,第 二 个 男孩 可 能 的 选 
择 就 只 有 C, 种 。 以 此 类 推 ， 可 以 计算 出 完美 匹配 的 可 能 情况 是 M = CI CC,，.… CI= nl 种 。 
如 果 仅 仅 从 排列 组 合 问题 的 角度 考虑 舞伴 问题 ， 随 着 男孩 们 的 顺序 变化 ， 这 个 数字 会 成 倍增 加 。 
那么 男孩 们 有 多 少 种 顺序 变化 呢 ?n 个 男孩 全 排列 ,结果 也 是 nl( P" ) 种 变化 ,因此 最 终 的 结果 应 
该 是 (n!)。 但 是 舞伴 问题 并 不 是 单纯 的 排列 组 合 问题 ， 因 为 这 些 男孩 和 女孩 之 间 通 过 各 自 的 偏爱 
列表 建立 了 某 种 联系 ,这 使 得 一 些 组 合 结果 实际 上 是 没有 意义 的 重复 。 举 个 例子 说 明 一 下 , 假如 
m 在 第 一 轮 选 择 ,他 选择 六 作为 舞伴 , 六 在 第 二 轮 选择 ， 他 选择 w' 作 为 舞伴 。 现 在 转换 一 下 选择 
顺序 ,， 改 为 m 在 第 一 轮 选择 , 但 是 m 的 偏爱 列表 中 , w 徘 在 前 面 , 于 是 闷 仍 然 选择 w 作 为 舞伴 ， 
m 也 只 能 选择 w 作为 舞伴 ， 虽然 选择 的 顺序 变 了 ,但 是 结果 和 前 一 次 一 样 。 

由 此 看 来 , 虽然 对 男孩 的 选择 顺序 进行 全 排列 有 n! 种 可 能 , 但 是 这 n! 种 选择 顺序 最 终 得 到 的 
匹配 结果 都 只 是 n! 种 结果 的 重复 出 现 , 实际 的 完美 匹配 只 有 nl! 种。 接 下 来 我 们 要 给 出 的 穷 举 算法 
也 验证 了 这 一 点 ， 对 于 3 个 男孩 和 3 个 女孩 的 情况 ， 穷 举 算法 得 到 了 36 (3!x3!=36 ) 个 完美 匹配 
结果 ， 排 除 掉 重 复 结果 后 得 到 6 (3x2x1=6 ) 个 结果 。 对 于 4 个 男孩 和 4 个 女孩 的 情况 ， 穷 举 算 
法 得 到 了 576( 4!x4!=576 ) 个 完美 匹配 结果 ， 排 除 掉 重 复 结果 后 得 到 24 ( 4x3x2x1=24 ) 个 结果 。 


7.3.1 穷 举 所 有 的 完美 匹配 


如 果 想 知道 到 底 有 多 少 个 稳定 匹配 , 首先 要 知道 有 多 少 个 完美 匹配 。 具 体 的 方法 就 是 使 用 穷 
举 的 方法 找到 全 部 的 完美 匹配 , 然后 根据 条 件 将 包含 不 稳定 因素 的 完美 匹配 过 滤 掉 , 剩 下 的 就 是 
稳定 匹配 。 遵 循 这 个 原则 ， 我 们 先 来 研究 一 下 穷 举 所 有 完美 匹配 的 算法 。 
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穷 举 算法 的 数据 结构 定义 仍然 沿用 7.2.1 节 算 法 实现 中 使 用 的 PARTNER 定义 ， 只 是 next 属性 
用 不 上 。 穷 举 的 方法 就 是 每 次 为 一 个 男孩 选择 一 个 舞伴 ,选择 的 方法 就 是 从 男孩 的 偏爱 列表 中 找 
一 个 还 没有 舞伴 的 女孩 ， 确 定 为 这 个 男孩 的 舞伴 ， 同 时 将 男孩 和 女孩 对 应 的 PARTNER 定义 中 的 
current 属性 指向 对 方 。 判 断 一 个 女孩 是 否 已 经 有 舞伴 的 方法 就 是 判断 她 的 current 属性 是 否 是 


-1， 如 果 不 是 -1 就 说 明 这 个 女孩 已 经 有 舞伴 了 。 按 照 男 孩 的 顺序 逐个 为 他 们 选择 舞伴 ， 当 最 后 
一 个 男孩 也 确定 了 舞伴 之 后 ， 就 得 到 了 一 个 完美 匹配 ， 可 以 打印 这 个 结果 ， 用 于 检查 是 否 正确 。 


SearchStableMatch( 


函数 是 搜索 算法 的 核心 ,采用 递归 方式 实现 ,每 次 为 一 个 男孩 选择 舞伴 。 


index 参数 是 男孩 按照 顺序 的 编号 , 从 0 开始 编号 , 刚好 对 应 boys 数组 的 下 标 , 简化 了 代码 实现 。 


当 index 等 于 


T (男孩 的 个 数 ) 时 ， 表 示 已 经 为 所 有 男孩 找到 了 舞伴 ， 如 果 算 法 没有 错 


误 ， 这 应 该 就 是 


个 完美 匹配 。 算 法 的 主体 就 是 遍历 index 对 应 的 男孩 的 偏爱 列表 ， 从 列表 中 找 
到 一 个 还 没有 舞伴 3 


也 喜欢 自己 的 女孩 作为 舞伴 ， 互 相 设 置 current 属性 。 需 要 注意 的 是 ， 算 


法 主体 包含 一 个 回溯 处 理 ， 当 某 一 级 搜索 结束 后 ， 要 重 置 相 关 男 孩 和 女孩 的 舞伴 关系 ,以便 后 序 
的 递归 搜索 能 够 正常 进行 。 有 具体 代码 可 看 SearchstableMatch() 函 数 的 for 循环 主体 部 分 。 


void SearchStableMatch(int index, PARTNER *boys, PARTNER *girls) 


if(index == UNIT COUNT) 


{ 


if(IsStableMatch(boys, girls)) 
{ 


printResult(boys, girls, UNIT COUNT); 


return; 


for(int i = 0; i < boys[index].pCount; i++) 


int gid = boys[index].perfect[i]; 


if(!IsPartnerAssigned(&girls[gid]) 8& IsFavoritepartner(&girls[gid], index)) 


boys[index] .current = gid; 
girls[gid].current = index; 
SearchStableMatch(index + 1, boys, girls); 
boys[index].current = -1; 
girls[gid].current = -1; 


} 
} 
} 


7.3.2 不 稳定 因素 的 判断 算法 


7.1.1 节 给 出 了 完美 匹配 中 不 稳定 因素 的 定义 ， 当 一 个 男孩 和 一 个 女孩 同时 有 比 他 们 当前 舞 


伴 更 “强烈 的 ”愿望 结 为 舞伴 的 时 候 ， 他 们 就 倾向 于 与 各 自 的 舞伴 分 开 ,， 然 后 结合 在 一 起 成 为 舞 
伴 。 不 稳定 因素 的 判断 算法 就 是 在 一 个 完美 匹配 中 找 出 图 7-1 所 示 的 情况 , 这 种 情况 有 两 个 特征 : 
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首先 ,男孩 的 当前 舞伴 不 是 他 的 偏爱 列表 中 排 在 第 一 位 的 女孩 , 也 就 是 说 ， 男 孩 更 偏爱 其 他 女孩 
胜 过 自己 当前 的 舞伴 ; 其 次 , 男孩 更 偏爱 的 那个 (或 那 几 个 女孩 中 的 一 个 ) 女孩 刚好 也 喜欢 这 个 
男孩 胜 过 自己 当前 的 舞伴 。 


于 是 , 不 稳定 因素 的 判断 算法 就 呼之欲出 了 , 重点 就 是 上 述 两 个 特征 的 识别 。 判 断 一 个 完美 
匹配 是 否 是 稳定 匹配 的 算法 流程 如 下 。 


(D 找 出 这 个 男孩 的 当前 舞伴 在 男孩 的 偏爱 列表 中 的 位 置 ， 如 果 当 前 舞伴 排 在 偏爱 列表 的 第 
一 位 ， 则 表示 这 个 男孩 不 存在 不 稳定 因素 的 可 能 ， 转 步骤 (4)。 如 果 当 前 鲜 伴 不 是 男孩 偏爱 列表 的 
第 一 位 ， 则 转 到 步骤 (2)。 

(2) 男孩 的 偏爱 列表 中 如 果 还 有 排 在 当前 舞伴 之 前 但 还 没有 进行 判断 处 理 的 女孩 ， 则 转 步 双 
G)， 否 则 转 步骤 ()。 

G) 找到 女孩 的 当前 舞伴 在 女孩 的 偏爱 列表 中 的 位 置 和 当前 处 理 的 男孩 在 女孩 的 偏爱 列表 中 
的 位 置 ， 如果 女孩 当前 舞伴 的 位 置 比 当前 处 理 的 男孩 的 位 置 舍 前 , 则 表示 对 该 女孩 不 存在 不 稳定 
因素 , 转 步 又 2)。 如 果 当前 处 理 的 男孩 的 位 置 比 女孩 当前 舞伴 的 位 置 靠 前 , 则 表示 存在 不 稳定 因 
素 ， 直 接 转 步 又 (6)。 

(4) 如 果 对 全 部 男孩 判断 完毕 ， 转 步骤 (3)。 和 否则， 继续 对 下 一 个 男孩 进行 不 稳定 因素 判断 ， 
转 步 又 (1)。 

(5) 结束 ， 没 有 找到 不 稳定 因素 。 

(6) 结束 ， 找 到 不 稳定 因素 ， 此 完美 匹配 不 是 稳定 匹配。 

根据 以 上 算法 流程 ,我 们 给 出 判断 稳定 匹配 的 算法 实现 ,如 IsStableltatch() 函数 所 示 , 非常 
简单 ， 相 关 的 注释 和 以 上 算法 流程 的 表述 都 能 对 上 ， 此 处 就 不 再 过 多 解释 。 


bool IsStableMatch(PARTNER *boys, PARTNER *girls) 
{ 


for(int i = 0; i < UNIT COUNT; i++) 
{ 
// 找 到 男孩 当前 舞伴 在 自己 的 偏好 列表 中 的 位 置 

int gpos = GetPerfectPosition(&boys[i], boys[i].current); 
// 在 position 位 置 之 前 的 甸 伴 ， 男 孩 喜欢 她 们 胜 过 current 
for(int k = 0; k < gpos; k++) 


{ 


nt gid = boys[i].perfect[k]; 

/找到 男孩 在 这 个 女孩 的 偏好 列表 中 的 位 置 

nt bpos = GetPerfectposition(8&girls[gid], i); 
// 找 到 女孩 的 当前 姓 伴 在 这 个 女孩 的 偏好 列表 中 的 位 置 
n 

二 


int cpos = GetperfectPosition(&girls[gid], girls[gid].current); 
if(bpos < cpos ) 


// 女 孩 也 是 喜欢 这 个 男孩 胜 过 喜欢 自己 当前 的 舞伴 ， 这 是 不 稳定 因素 
return false; 
} 
} 
} 
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return true; 


} 
7.3.3” 穷 举 的 结果 


至 此 , 我 们 有 了 穷 举 法 搜索 全 部 稳定 匹配 结果 的 算法 , 来 看 看 结果 吧 。 假设 有 以 下 男孩 和 女 
孩 的 数据 ， 冒 号 后 是 对 应 男孩 和 女孩 的 偏爱 列表 。 


男孩 


Albert: Laura, Nancy, Marcy 
Brad: Marcy, Nancy, Laura 
Chuck: Laura, Marcy, Nancy 


女孩 


Laura: Chuck, Albert, Brad 
Marcy: Albert, Chuck, Brad 
Nancy: Brad, Albert, Chuck 


应 用 算法 搜索 后 得 到 以 下 结 


Albert[1] <---> Nancy[1] 
Brad[0] <---> Marcy[2] 
Chuck[0] <---> Laura[0 


Total Matchs : 6, Stable Matchs : 2 

看 来 ， 有 两 个 稳定 匹配 的 结果 ， 用 7.2.1 节 给 出 的 Gale-Shapley 算法 得 到 的 只 是 前 一 个 稳定 
匹配 的 结果 。 参 考 资料 站 给 出 了 一 个 有 意思 的 结论 ， 就 是 稳定 匹配 的 个 数 总 是 2 的 整数 寡 ， 有 兴 
趣 的 读者 可 阅读 一 下 该 资料 ,看 看 这 个 结论 的 来 龙 去 脉 。 另 外 , 这 个 资料 还 给 出 了 只 有 一 种 稳定 
匹配 结果 的 情况 , 即 所 有 的 女孩 的 偏爱 列表 都 完全 一 样 的 时 候 , 无 论 男孩 们 的 偏爱 列表 如 何 选择 ， 
最 终 都 只 有 一 种 稳定 匹配 结果 ， 有 兴趣 的 读者 也 可 以 自己 研究 研究 。 


7.4 二 部 图 与 二 分 匹配 


之 前 讨论 稳定 匹配 问题 的 时 候 , 我 们 把 完美 匹配 定义 为 每 个 男人 和 女人 都 属于 匹配 中 的 某 个 
对 ,并 不 是 很 直观 , 现在 我 们 准备 用 图 的 术语 更 一 般 地 表达 完美 匹配 的 概念 。 首 先 介 绍 一 下 二 部 
图 ,二 部 图 G=(7,E) 是 这 样 的 一 个 图 ， 它 的 项 点 集合 修 可 以 划分 为 和 了 两 个 集合 ， 它 的 边 集合 
互 中 的 每 条 边 都 有 一 个 端点 在 集合， 另 一 个 端点 在 7 了 集合。 图 7-2 就 是 一 个 二 部 图 。 

现在 给 出 针对 二 部 图 的 匹配 的 定义 , 给 定 一 个 二 部 图 G=( 了 ,BE) 的 子 图 M, 如 果 MM 的 边 集 中 任 
意 两 条 边 都 不 依附 于 同一 个 顶点 ， 则 称 MM 是 一 个 匹配 。 简 单 地 说 ， 图 7-2 中 xy、x3、x 等 点 都 有 
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多 条 边 与 之 连接 ， 也 就 是 说 有 多 个 边 依附 于 这 些 点 ， 因 此 图 7-2 所 示 的 二 部 图 不 是 一 个 匹配 。 现 
在 考虑 删除 一 些 边 , 最 终 得 到 如 图 7-3 所 示 的 一 个 G 的 子 图 。 该 子 图 中 没有 任何 边 同时 连接 外 或 
7 中 的 同一 个 顶点 ， 因 此 这 是 一 个 匹配 。 


如 果 G 的 一 系列 子 图 Mo,M1…,M 都 是 匹配 , 那么 包含 边 数 最 多 的 那个 匹配 就 是 图 G 的 最 大 
匹配 。 如 果 一 个 最 大 匹配 中 所 有 的 点 都 有 边 与 之 相连 ,没有 未 履 盖 点 ， 则 这 个 最 大 匹配 就 是 完美 
匹配 。 未 徐 羔 点 的 定义 是 : 图 G 的 一 个 顶点 厂 ， 如 果 万 不 与 任何 一 条 属于 匹配 M 的 边 相 连 ， 则 
成 帮 是 一 个 未 覆盖 点 。 图 7-3 就 是 一 个 完美 匹配 。 


CO 


图 7-2 简单 的 二 部 图 图 7-3 一 个 完美 匹配 的 二 部 图 


根据 以 上 定义 ， 如 果 G 的 一 个 匹配 M 是 最 大 匹配 ， 并 且 没 有 未 履 盖 点 ， 则 这 个 匹配 就 是 完 
美 匹配 。 可 见 ， 图 G 的 匹配 和 完美 匹配 正好 就 是 之 前 介绍 的 “稳定 婚姻 问题 ”中 的 匹配 和 完美 
匹配 。 用 图 论 的 方法 寻找 完美 匹配 , 需要 首先 找到 最 大 匹配 ， 当 二 部 图 中 两 个 顶点 集合 中 的 顶点 
个 数 相等 时 ， 这 个 最 大 匹配 同时 也 是 完美 匹配 。 求 二 部 图 的 最 大 匹配 可 以 使 用 最 大 流 (maximal 
flow ) 或 匈牙利 算法 (Hungarian algorithm )， 接 下 来 我 们 就 来 介绍 匈牙利 算法 。 


7.4.1 最 大 匹配 与 匈牙利 算法 


寻找 二 部 图 最 大 匹配 的 匈牙利 数学 家 埃 德 蒙 德 斯 ( Edmonds ) 在 1965 年 提出 的 一 个 简化 的 
最 大 流 算法 。 该 算法 根据 二 部 图 匹配 这 个 问题 的 特点 将 最 大 流 算法 进行 了 简化 , 提高 了 效率 。 普 
通 的 最 大 流 算法 一 般 都 是 基于 讲 权 网 络 模型 的 ， 二 部 图 匹配 问题 不 需要 区 分 图 中 的 源 点 和 汇 点 ， 
也 不 关心 边 的 方向 ， 因 此 不 需要 复杂 的 网 络 图 模型 ， 这 就 是 匈牙利 算法 简化 的 原因 。 正 是 因为 这 
个 原因 ， 匈 牙 利 算法 成 为 一 种 很 简单 的 二 分 匹配 算法 ， 其 基本 流程 是 : 
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将 图 G 最 大 匹配 初始 化 为 空 
while( 从 Xi 点 开始 在 图 G 中 找到 新 的 增 广 路 径 ) 


将 增 广 路 径 加 入 到 最 大 匹配 中 ; 

i 

根据 匈牙利 算法 的 流程 看 ， 寻 找 图 G 中 的 增 广 路 径 ( Augment Path ) 是 匈牙利 算法 的 关键 。 
先 来 看 看 什么 是 增 广 路 径 ， 二 部 图 中 的 增 广 路 径 具有 以 下 性 质 ， 
口 路 径 中 边 的 条 数 是 奇数 ; 
D 路 径 的 起 点 在 二 部 图 的 左 半 边 ， 终 点 在 二 部 图 的 右 半边 ; 
口 路 径 上 的 点 一 个 在 左 半边 ， 一 个 在 右 半边 ， 交 符 出 现 ， 整 条 路 径 上 没有 重复 的 点 ; 
口 只 有 路 径 的 起 点 和 终点 都 是 未 覆盖 的 点 ， 路 径 上 其 他 的 点 都 已 经 配对 ; 
D 对 路 径 上 的 边 按照 顺序 编号 ， 所 有 奇数 编号 的 边 都 不 在 已 知 的 匹配 中 ， 所 有 偶数 编 号 的 
边 都 在 已 知 的 匹配 中 ， 
D 对 增 广 路 径 进行 “ 取 反 ”操作 ， 新 的 匹配 数 就 比 已 知 匹配 数 增加 一 个 ， 也 就 是 说 ， 可 以 

得 到 一 个 更 大 的 匹配。 

所 谓 的 增 广 路 径 取 反 操作 ,就 是 把 增 广 路 径 上 奇数 编号 的 边 加 入 到 已 知 匹配 中 , 并 把 增 广 路 
径 上 偶数 编号 的 边 从 已 知 匹配 中 删除 。 每 做 一 次 “ 取 反 ”操作 ， 得 到 的 匹配 就 比 原 匹配 多 一 个 。 
匈牙利 算法 的 思路 就 是 不 停 地 寻找 增 广 路 径 ， 增 加 匹配 的 个 数 ， 当 不 能 再 找到 增 广 路 径 时 ,算法 
就 结束 了 ， 得 到 的 匹配 就 是 最 大 匹配 。 


增 广 路 径 的 起 点 总 是 在 二 部 图 的 左边 , 因此 寻找 增 广 路 径 的 算法 总 是 从 一 侧 的 顶点 开始 , 逐 
个 顶点 搜索 。 从 万 顶点 开始 搜索 增 广 路 径 的 流程 如 下 : 

while( 从 Xi 的 邻接 表 中 找到 下 一 个 关联 顶点 Yj) 

{ 


if( 顶 点 Yi 不 在 增 广 路 径 上 ) 

{ 
将 Wi 加 入 增 广 路 径 ; 
if(Yj 是 未 覆盖 点 或 者 从 与 Yj 相 关连 的 顶点 (Xi ) 能 找到 增 广 路 径 ) 
{ 


将 的 关联 顶点 修改 为 Xi 
从 顶点 Xi 开始 有 增 广 路 径 ， 返 回 true; 


} 
从 顶点 Xi 开始 没有 增 广 路 径 ， 返回 false; 
} 
在 这 个 算法 流程 中 ,“ 从 与 相关 连 的 顶点 (及 ) 能 找到 增 广 路 径 ” 这 一 步 体 现 的 是 一 个 递 


归 过 程 。 因 为 如 果 之 前 的 搜索 已 经 将 允 加 入 到 增 广 路 径 中 ,说明 了 在 集合 中 一 定 有 一 个 关联 
点 ， 我 们 假设 在 了 集合 中 的 这 个 关联 点 是 了 县， 所 以 要 从 及 开始 继续 寻找 增 广 路 径 。 当 从 至 
开始 的 递归 搜索 完成 后 ， 通 过 “将 的 关联 顶点 修改 为 ”这 一 步 操作 ， 将 其 与 铸 连 在 一 起 ， 
形成 一 条 更 长 的 增 广 路 径 。 
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到 现在 为 止 ， 匈 牙 利 算法 的 流程 已 经 很 清楚 了 ,现在 我 们 来 给 出 实现 代码 。 首 先 定义 求 最 大 
匹配 的 数据 结构 ， 这 个 数据 结构 要 能 表示 二 部 图 的 边 的 关系 ， 还 要 能 体现 最 终 的 增 广 路 径 结果 ， 
我 们 给 出 如 下 定义 : 

typedef struct tagMaxMatch 

int edge[UNIT COUNT][UNIT COUNT]; 
bool on path[UNIT COUNT]; 
int path[UNIT COUNT]; 


int max_ match; 
}GRAPH MATCH; 
edge 是 顶点 与 边 的 关系 表 ， 用 来 表示 二 部 图 ，on_path 用 来 表示 顶点 是否 已 经 在 当前 搜索 
过 程 中 形成 的 增 广 路 径 上 了 ，path 是 当前 找到 的 增 广 路 径 ，max_match 是 当前 增 广 路 径 中 边 的 条 
数 ， 当 算法 结束 时 ， 如 果 max_match 不 等 于 顶点 个 数 ， 说 明 有 顶点 不 在 最 大 增 广 路 径 上 ， 也 就 是 
说 ， 找 不 到 能 覆盖 所 有 点 的 增 广 路 径 ， 此 二 部 图 没有 最 大 匹配 。 从 总 寻找 增 广 路 径 的 算法 实现 
如 下 : 


bool FindAugmentPath(GRAPH MATCH *match, int xi) 


{ 
for(int yj = 0; yj < UNIT_ COUNT; yj++) 
{ 
if((match->edge[xi][yj] == 1) 8& !match->on path[yj]) 
{ 
match->on_path[yj] = true; 
if( (match->path[yj] == -1) 
|| FindAugmentPath(match, match->path[yj]) ) 
match->path[yj] = xi; 
return true; 
} 
} 
} 


return false; 
} 
算法 实现 基本 上 是 按照 之 前 的 算法 流程 实现 的 , 不 需要 做 特别 说 明 , 唯一 需要 注意 的 是 path 
中 存放 增 广 路 径 的 方式 。 读 者 可 能 已 经 注意 到 了 ， 存 放 的 方式 是 以 了 集合 中 的 顶点 为 索引 存放 ， 
其 值 是 对 应 的 关联 顶点 在 了 集合 中 的 索引 。 搜索 是 按照 了 集合 中 的 顶点 索引 进行 的 , 增 广 路 径 以 
7 集合 中 的 顶点 为 索引 存储 , 关系 是 反 的 。 输出 结果 的 时 候 , 需要 结合 了 集合 中 的 顶点 索引 输出 ， 
如 果 需 要 以 集合 的 顺序 输出 结果 ， 需 要 反 向 转换 ， 转 换 的 方法 非常 简单 : 


int path[UNIT COUNT] = { 0 }; 


for(int i = 0; i < match->max match; i++) 
{ 

path[match->path[i]] = i; 
} 
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转换 后 path 中 就 是 以 了 集合 的 顺序 存放 的 结果 。 
结合 之 前 给 出 的 匈牙利 算法 基本 流程 ， 最 后 给 出 匈牙利 算法 的 入口 函数 实现 : 


bool Hungary Match(GRAPH MATCH *match) 
{ 


for(int xi = 0; xi < UNIT COUNT; xi++) 
if(FindAugmentPath(match, xi)) 
{ 


match->max_match++; 


+ 
ClearOnpathSign(match); 


} 
return (match->max match == UNIT COUNT); 


每 完成 一 个 顶点 的 搜索 ， 需 要 重 置 了 集合 中 相关 顶点 的 on_path 标志 ，ClearOnPathsign() 媚 
数 就 负责 干 这 个 事情 。 

我 们 用 图 7-2 中 的 二 部 图 数据 初始 化 GRAPH_MATCH 中 的 顶点 关系 表 edge, 然 后 调用 Hungary Match() 
函数 得 到 一 组 匹配 : 

X1<--->Y3 

X2<--->Y1 

X3<--->Y4 

X4<--->Y2 

X5<--->Y5 

结果 与 图 7-3 一 致 ， 因 为 这 个 最 大 匹配 没有 未 覆盖 点 ， 所 以 是 完美 匹配 。 

匈牙利 算法 的 实现 以 顶点 集合 亚 为 基础 ， 每 次 X 集 合 中 选 一 个 顶点 子 做 增 广 路 径 的 起 点 搜 


索 增 广 路 径 , 搜 索 增 广 路 径 需 要 裔 历 边 集 E 内 的 所 有 边 , 遍 历 方法 可 以 采用 深度 优先 遍历 ( DFS )， 
也 可 以 采用 广度 优先 遍历 (BFS )， 无 论 什 么 方法 ， 其 时 间 复 杂 度 都 是 0(5)。 匈 牙 利 算法 每 个 顶 
点 万 只 能 选择 一 次 , 因此 算法 的 整体 时 间 复 杂 度 是 O(V*E)， 总 的 来 说 ,是 一 个 相当 高 效 的 算法 。 
除了 匈牙利 算法 ， 求 二 部 图 的 最 大 匹配 还 可 以 使 用 Hopcroft-Karp 算法 。Hopcroft-Karp 算法 是 由 
Hopcroft 和 Karp 在 1972 年 提出 的 一 种 算法 ， 也 是 最 大 流 算 法 的 一 种 改进 算法 。 算 法 的 基本 思想 
就 是 在 每 次 搜索 增 广 路 径 的 时 候 不 是 只 找 一 条 增 广 路 径 ， 而 是 同时 找 几 条 互 不 相交 的 增 广 路 径 ， 
形成 最 大 增 广 路 径 集 合 , 然后 沿 着 集合 中 的 几 条 增 广 路径 同 时 扩大 增 广 路径 长 度 。 通 过 进一步 的 
分 析 ，Hopcroft-Karp 算法 的 时 间 复 杂 度 可 以 达到 O(sqrt( 四 *E)， 也 非常 高 效 。 


发 


7.4.2” 带 权 匹 配 与 Kuhn-Munkres 算法 


上 一 节 我 们 介绍 了 二 部 图 的 最 大 匹配 算法 ， 用 匈牙利 算法 寻找 最 大 匹配 ， 不 要 求 每 个 个 体 
给 出 的 偏爱 列表 包含 全 部 异性 成 员 。 比 如 在 舞伴 问题 中 ,如 果 Albert 非常 讨厌 Marcy, 那 么 Albert 
的 偏爱 列表 无 论 如 何 也 不 会 包含 Marcy。 在 这 一 节 ， 我们 让 舞伴 问题 再 复杂 一 点 ， 于 是 为 舞伴 


7.4 二 部 图 与 二 分 匹配 二 89 


问题 引入 带 权 优先 表 的 概念 ， 为 每 一 个 配对 指定 一 个 权重 ， 表 明 我 们 更 希望 哪 一 对 成 为 舞伴 。 
通过 控制 每 一 对 舞伴 关系 的 权重 ， 使 得 最 后 的 完美 匹配 结果 中 有 尽量 多 的 舞伴 是 我 们 所 期 望 的 
配对 关系 。 

这 个 问题 变 得 有 点 像 最 优 解 问题 了 , 一 提 到 与 图 有 关 的 最 优 解 问题 ,你 会 想到 穷 举 法 。 穷 举 
所 有 的 完美 匹配 , 然后 计算 每 个 完美 匹配 中 各 边 的 权重 之 和 , 取 权 重 之 和 最 大 的 一 个 作为 最 后 的 
结果 。 这 是 一 种 解决 方案 ,但 是 穷 举 法 虽然 是 万 能 方法 ,但 是 不 到 万 不 得 已 最 好 不 要 用 穷 举 法 。 
仔细 思考 一 下 , 其 实 这 个 问题 已 经 演化 成 了 求解 二 部 图 的 带 权 匹配 问题 , 所 谓 二 部 图 的 带 权 匹 配 
其 实 就 是 求 出 一 个 匹配 集合 , 使 得 集合 中 各 边 的 权 值 之 和 最 大 或 最 小 。 对 于 本 问题 , 给 每 一 个 配 
对 ( 图 中 的 边 ) 指定 一 个 权重 之 后 问题 就 变 成 了 求 二 部 图 的 带 权 最 大 匹配 问题 。 


通过 之 前 对 Gale-Shapley 算法 和 匈牙利 算法 的 介绍 , 我 们 已 经 了 解 了 完美 匹配 、 稳 定 匹配 和 
最 大 匹配 这 些 概念 , 那么 带 权 匹 配 和 之 前 的 这 些 概念 是 什么 关系 呢 ? 答案 是 没有 半 毛 钱 关系 , 至 
少 和 完美 匹配 与 最 大 匹配 之 间 不 存在 包含 或 等 于 关系 。 二 部 图 的 最 大 权 或 最 小 权 匹 配 ， 只 是 要 求 
得 到 的 一 个 匹配 中 各 边 的 权 值 之 和 最 大 或 最 小 , 并 不 要 求 这 个 匹配 是 完美 匹配 或 最 大 匹配 。 如 果 
这 个 权 值 最 大 (或 最 小 ) 的 匹配 同时 又 是 完美 匹配 ， 则 这 样 的 结果 就 被 称 为 最 佳 匹配 。 本 节 我 们 
要 介绍 的 Kuhn-Munkres 算法 是 求 最 大 权 或 最 小 权 匹 配 的 算法 ,如 果 期 望 Kuhn-Munkres 算 法 得 到 
的 结果 同时 是 一 个 完美 匹配 (最 佳 匹配 )， 那 么 要 求 算 法 运行 的 数据 必须 存在 完美 匹配 ( 比如 两 
个 顶点 集合 的 顶点 个 数 必须 相等 之 类 的 条 件 ), 很 多 同学 会 忽略 这 一 点 , 以 为 Kuhn-Munkres 算法 
可 以 在 任何 情况 下 得 到 带 权 的 最 大 匹配 ， 这 个 理解 是 错误 的 。 

Kuhn-Munkres 算法， 也 称 KM 算法 ,是 Kuhn 和 Munkres 二 人 在 1955 ~ 1957 年 各 自 独立 提 
出 的 一 种 算法 ， 是 一 种 求解 最 大 最 小 权 匹 配 问 题 的 经 典 算 法 。 最 初 的 Kuhn-Munkres 算法 以 矩阵 
为 基础 结构 , 但 是 Edmonds 在 1965 年 发 布 了 匈牙利 算法 之 后 , Kuhn-Munkres 算法 也 基于 匈牙利 
算法 进行 了 改进 。 当 给 定 的 二 部 图 存在 完美 匹配 的 情况 下 ，Kuhn-Munkres 算法 通过 给 每 个 顶点 
设置 一 个 标号 ( 叫 作 顶 标 ) 的 方式 把 求 最 大 权 匹 配 的 问题 转化 为 求 完美 匹配 的 问题 的 ， 最 终 得 到 
一 个 最 大 权 完 美 匹配 。 那 么 这 个 转换 是 如 何 实现 的 呢 ? 这 就 需要 分 析 一 下 Kuhn-Munkres 算法 的 
原理 了 。 


我 们 假设 二 部 图 中 外 顶点 集合 中 每 个 顶点 怨 的 项 标 是 4[i], 了 顶点 集合 中 每 个 顶点 二 的 顶 标 
是 B[]， 顶点 也 和 了 之 间 的 边 的 权重 是 weight[i][ 有 站， 则 Kuhn-Munkres 算法 的 原理 就 是 基于 以 下 
定理 : 


若 由 二 部 图 中 所 有 满足 4[HB 四 = weight[ij] 的 边 (%, 六 构成 的 子 图 ( 称 作 相等 子 图 ) 有 完美 
匹配 ， 那 么 这 个 完美 匹配 就 是 二 分 图 的 最 大 权 匹 配 。 

现在 明白 转换 原理 了 吧 , 就 是 先 找 出 问题 对 应 的 相等 子 图 ,然后 求 相等 子 图 的 完美 匹配 即 可 。 
现在 的 问题 是 ， 这 个 定义 成 立 吗 ? 答案 是 只 要 在 算法 过 程 中 始终 满足 “4[i]+BD] 二 weight[iy]” 
这 个 条 件 , 这 个 定理 就 成 立 。 因为 对 于 二 分 图 的 任意 一 个 匹配 , 如 果 这 个 匹配 是 相等 子 图 的 匹配 ， 
那么 它 的 边 权 重 之 和 等 于 所 有 顶点 的 顶 标 之 和 ( 显然 这 是 最 大 的 ); 如 果 这 个 匹配 不 是 相等 子 图 
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的 匹配 ( 它 的 某 些 边 不 属于 相等 子 图 )， 那 么 它 的 边 权 重 之 和 小 于 所 有 顶点 的 项 标 和 。 所 以 只 要 
始终 满足 “4[i]+B 四 三 weight[iy]” 条 件 的 相等 子 图 的 完备 匹配 一 定 是 二 分 图 的 最 大 权 匹 配 。 


根据 以 上 分 析 可 知 ，Kuhn-Munkres 算法 的 实现 流程 大 致 如 下 所 示 。 


(2) 找 出 符合 “4[i]+B[D] = weight[iy]” 条 件 的 边 构 成 相等 子 图 ， 使 用 匈牙利 算法 寻找 相等 子 
图 的 完美 匹配 ; 

(3) 如 果 找 到 相等 子 图 的 完美 匹配 ， 则 算法 结束 ， 否 则 调整 相关 顶点 的 项 标 值 ; 

(4) 重复 步骤 (2)(3)， 直 到 找到 完美 匹配 为 止 。 


第 (0) 步 初始 化 顶点 顶 标 值 可 采用 式 (7-D 计 算 ; 


i = max {weight[x,][y0], weight[x,][7,],.…, weight[x, ][y,]},x eX 二 


Bly,]=0,y,eY 

因为 4 四 总 是 取 与 之 相 邻 的 边 中 最 大 的 权 值 作 为 初始 值 ,因此 初始 阶段 能 保证 满足 “4[1+HB 胃 
过 weight[ij]” 条 件 。 如 果 在 第 (2) 步 的 相等 子 图 中 没有 找到 完美 匹配 ， 说 明 相 等 子 图 中 某 个 顶点 
出 发 的 增 广 路 径 不 能 覆盖 所 有 顶点 。 此 时 需要 调整 各 个 顶点 的 顶 标 值 , 然后 重新 在 相等 子 图 中 寻 
找 完美 匹配 。 调 整 顶 标的 目的 是 为 了 扩大 相等 子 图 , 使 得 更 多 的 边 进 入 相等 子 图 ， 并 最 终 能 够 找 
到 一 个 完美 匹配 。 设 当前 增 广 路 径 上 所 有 属于 马 集 合 的 顶点 构成 一 个 子 集 9$， 所 有 属于 了 集合 的 

顶点 构成 一 个 子 集 7，dx 为 顶 标 调整 的 变化 量 ， 则 dx 可 采用 式 (7-2) 给 出 的 方法 计算 : 
dx=min{Alx,]+ Bly,]— weight[x, ][y,], sw 和 7 (7-2) 


由 dx 的 计算 公式 可 知 ， 如 果 把 S$ 集合 中 所 有 顶点 的 顶 标 都 减少 dx， 一 定 会 有 一 条 一 端 在 S 
中 ， 另 一 端 不 在 7 中 的 边 因 满 足 “4[i]+B[]= weight[iy]” 的 条 件 而 进入 相等 子 图 ， 这 就 扩大 了 相 
等 子 图 。 对 $ 集合 中 所 有 顶点 的 顶 标 都 减少 dx 之 后 ， 为 了 使 原来 已 经 在 相等 子 图 中 的 边 继续 留 
在 相等 子 图 中 ， 需 要 将 7 集合 中 所 有 顶点 的 顶 标 值 增加 dg， 使 4[ 站 HB 站 之 和 不 变 。 

现在 总 结 一 下 顶 标 调整 的 方法 , 首先 采用 式 (7-2) 计 算出 调整 变化 量 dx, 然后 将 S$ 集合 中 所 有 
顶点 的 顶 标 值 减少 dx， 同 时 将 7 集合 中 所 有 顶点 的 项 标 值 增加 dx， 这 样 的 调整 ， 对 整个 图 上 的 
所 有 顶点 会 产生 如 下 四 种 结 
口 对 于 两 端点 都 在 当前 相等 子 图 的 增 广 路 径 上 的 边 (x yy )， 其 顶 标 值 4[i]+B 中 的 和 没有 变 
化 。 也 就 是 说 ， 原 来 属于 相等 子 图 的 边 ， 调 整 后 仍然 属于 相等 子 图 。 

口 对 于 两 端点 都 不 在 当前 相等 子 图 的 增 广 路 径 上 的 边 (xz 六) 其 顶 标 值 4 站 和 四 的 值 没有 
变化 。 也 就 是 说 ， 此 边 与 相等 子 图 的 隶属 关系 没有 变化 ， 原 来 属于 相等 子 图 的 边 现在 仍 
然 属于 相等 子 图 ， 原 来 不 属于 相等 子 图 的 边 现在 仍然 不 属于 相等 子 图 。 

口 对 于 x 在 当前 相等 子 图 的 增 广 路 径 上 ，y 不 在 当前 相等 子 图 的 增 广 路 径 上 的 边 (x, yj )， 
其 顶 标 值 4[i]+8 中 的 和 略 有 减 小 , 原来 不 属于 相等 子 图 , 现在 有 可 能 属于 相等 子 图 , 使 得 
相等 子 图 有 机 会 得 到 扩大 。 
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口 如 果 x; 不 在 当前 相等 子 图 的 增 广 路 径 上 ,yj 在 当前 相等 子 图 的 增 广 路 径 上 的 边 (x, yj )， 
其 顶 标 值 4 四 +B8 四 的 和 略 有 增加 ， 原 来 不 属于 相等 子 图 ， 现 在 仍 不 属于 相等 子 图 。 


由 此 可 见 , 每 次 调整 顶 标 ,都 能 在 图 的 基本 状态 保持 不 变 的 情况 下 扩大 相等 子 图 , 使 得 相等 
子 图 有 机 会 找到 一 个 完美 匹配 ， 这 就 是 项 标 值 调整 在 算法 中 的 意义 所 在 。 

现在 ,我 们 就 结合 一 个 带 权 最 大 匹配 问题 的 实例 ， 给 出 这 个 算法 在 实际 应 用 中 的 一 个 实现 。 
问题 是 这 样 的 ， 某 公司 有 5 名 技术 工人 ,他 们 都 可 以 完成 公司 流程 中 的 5 种 工作 , 但 是 每 个 工人 
的 技术 侧重 点 不 同 , 熟练 程度 也 不 同 ， 因 此 他 们 完成 同样 的 工作 所 产生 的 经 济 效益 也 不 相同 。 如 
果 用 0~5 范围 内 的 值 对 每 个 工人 完成 每 种 工作 所 产生 的 经 济 效益 进行 评价 ， 可 得 到 如 表 7-1 所 
示 的 经 济 效益 矩阵 。 假 如 你 是 这 家 公司 的 负责 人 ， 你 需要 找到 一 种 工人 和 工作 之 间 的 匹配 关系 ， 
使 得 这 种 匹配 关系 能 产生 的 经 济 效益 最 大 。 根 据 之 前 对 Kuhn-Munkres 算法 的 分 析 ， 我 们 针对 这 
个 问题 设计 了 KM_MATCH 匹配 数据 结构 ， 如 下 所 示 : 

typedef struct tagkmMatch 


int edge[UNIT_COUNT][UNIT_COUNT]; //Xi 与 Yj 对 应 的 边 的 权重 
bool sub_map[UNIT_COUNT][UNIT_COUNT];// 二 分 图 的 相等 子 图 ，sub_map[i][j] = 1 代表 Xi 与 Yj 有 边 
bool x_on_path[UNIT_COUNT]; // 标记 在 一 次 寻找 增 广 路 径 的 过 程 中 ，Xi 是 否 在 增 广 路 径 上 
bool y_on_path[UNIT_COUNT]; // 标记 在 一 次 寻找 增 广 路 径 的 过 程 中 ，Yi 是 否 在 增 广 路 径 上 

int path[UNIT_COUNT]; // 匹配 信息 ， 其 中 为 Y 中 的 顶点 标号 ，path[i] 为 X 中 顶点 标号 
}KM_MATCH; 


相对 于 匈牙利 算法 中 的 GRAPH_MATCH 定义 ,KM_MATCH 的 主要 变化 是 增加 了 sub_map 作为 相等 子 
图 定义 和 标识 y; 是 否 在 增 广 路 径 上 的 y_on_path 标识 。 相 对 于 我 们 前 面 对 Kuhn-Munkres 算法 的 分 
析 ，edge 对 应 于 边 的 权重 表 weight，sub_map 对 应 于 算法 执行 过 程 中 的 相等 子 图 ，x_on_path 和 


y_on_path 分 别 用 于 标识 也 集合 和 了 集合 中 的 顶点 是 否 属 于 增 广 路 径 上 的 集合 和 了 集合 ，path 
就 是 最 后 匹配 的 结果 。 
表 7-1 不 同 工 人 完成 不 同 工 作 的 经 济 效益 
工作 1 工作 2 工作 3 工作 4 工作 5 

工人 1 3 5 5 4 1 

工人 2 2 2 0 2 2 

工人 3 2 4 4 1 0 

工人 4 0 1 1 0 0 

工人 5 1 2 1 3 3 


下 面 给 出 Kuhn-Munkres 算法 的 具体 实现 代码 ，Kuhn_Munkres_Match() 函 数 虽然 很 长 ， 但 是 并 
不 难 理解 ， 因 为 这 个 代码 是 严格 按照 之 前 给 出 的 Kuhn-Munkres 算法 的 流程 实现 的 。 包 括 顶 标的 
初始 化 .使 用 匈牙利 算法 求 完美 匹配 和 顶 标 调整 在 内 的 三 个 主要 算法 步骤 在 Kuhn_Munkres_Match() 
函数 中 都 得 到 体现 ,并 且 界 定 非常 清晰 。 其 中 寻找 增 广 路 径 的 FindAugmentpPath() 函 数 与 之 前 介绍 
人 铭 牙 利 算法 时 给 出 的 FindAugmentpPath() 函 数 实现 非常 类 似 ， 区 别 就 是 使 用 sub_map 而 不 是 直接 使 
用 edge， 并 且 额 外 记录 了 x_on_path 标识 。ResetMatchPath() 函 数 负责 每 次 开始 寻找 相等 子 图 之 前 
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清除 上 一 次 搜寻 产生 的 临时 增 广 路 径 ，ClearonPathsign() 函 数 负责 在 每 次 搜寻 增 广 路 径 之 前 清除 
顶点 是 否 属于 5S 集合 或 7 集合 的 标识 ， 大 家 可 以 从 本 书 的 配套 代码 中 找到 此 函数 的 代码 。 


bool Kuhn Munkres Match(KM MATCH *km) 
{ 


nh 

int A[UNIT COUNT], B[UNIT COUNT]; 
// 初始 化 Xi 与 Yi 的 顶 标 

for(i = 0; i < UNIT COUNT; i++) 


{ 
B[i] = 0; 
A[i] = -INFINITE; 
for(j = 0; j < UNIT_COUNT; j++) 
{ 
A[i] = std::max(A[i], km->edge[i][j]); 
} 
} 
while(true) 
{ 


// 初始 化 带 权 二 分 图 的 相等 子 图 
for(i = 0; i < UNIT COUNT; i++) 


{ 
for(j = 0; j < UNIT COUNT; j++) 
{ 
se my sta De 


} 
// 使 用 铭 牙 利 算法 寻找 相等 子 图 的 完备 匹配 
int match = 0; 


ResetMatchPath(km) ; 
for(int xi = 0; xi < UNIT COUNT; xi++) 
{ 
ClearOnpathSign(km); 
if(FindAugmentPath(km, xi)) 
match++; 
else 
{ 


km->x_on path[xi] = true; 
break; 


} 


} 

// 如 果 找 到 完备 匹配 就 返回 结果 
if(match == UNIT COUNT) 

. 


} 

// 调 整 顶 标 ， 继 续 算 法 

int dx = INFINITE; 

for(i = 0; i < UNIT COUNT; i++) 
{ 


return true; 


if(km->x_on_path[i]) 
{ 
for(j = 0; j < UNIT COUNT; j++) 
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{ 
if(!km->y_on_path[j]) 
dx = std::min(dx, A[i] + B[j] - km->edge[i][j]); 
} 
} 
} 
for(i = 0; i < UNIT COUNT; i++) 


if(km->x_on_path[i]) 
A[i] -= dx; 
if(km->y_on_path[i]) 
B[i] += dx; 
} 
} 


return false; 


根据 表 7-1 提供 的 数据 初始 化 KM_MATCH 数据 结构 , 然后 调用 Kuhn_Munkres_Match() 函 数 , 得 到 
一 个 最 大 权 匹 配 的 结果 ， 因 为 原 数 据 存 在 完美 匹配 ， 因 此 这 个 结果 就 是 最 佳 匹配 结果 : 

工人 1 分 配 工 作 3 (经 济 效益 评价 是 5 ) 

工人 2 分 配 工 作 1 (经 济 效益 评价 是 2 ) 

工人 3 分 配 工 作 2 (经 济 效益 评价 是 4 ) 

工人 4 分 配 工作 5 (经 济 效益 评价 是 0 ) 

工人 $ 分 配 工 作 4 (经 济 效益 评价 是 3 ) 


最 后 获得 最 大 经 济 效益 评价 是 14。 需 要 说 明 的 是 ， 对 于 同一 个 问题 ， 其 最 大 权 匹 配 的 结 
可 能 不 唯一 ， 也 就 是 说 ， 存 在 多 个 匹配 的 权重 之 和 同 为 最 大 值 的 情况 。Kuhn-Munkres 算法 可 以 
找 出 其 中 的 一 个 ， 但 是 无 法 找到 全 部 匹配 结果 。 


7.5 总 结 


各 种 匹配 问题 可 不 是 仅仅 用 来 娱乐 的 算法 竞赛 题目 ， 它 们 在 现实 生活 中 都 有 着 广泛 的 应 用 。 
比如 稳定 匹配 原理 作为 一 种 资源 的 分 配方 法 ， 就 在 美国 的 医疗 体系 中 得 到 了 广泛 应 用 。19 世纪 
40 年 代 ， 在 先进 医疗 技术 的 引领 下 ， 美 国 的 医疗 体系 得 到 了 巨大 的 发 展 ， 但 是 稀缺 的 医学 院 毕 
业 生 成 了 这 个 体系 的 心病 。 为 了 争 抢 稀 缺 资 源 ， 医 院 被 迫 在 学 生 毕 业 前 好 几 年 就 向 他 们 提供 实习 
机 会 。 学 生 们 则 在 还 没有 被 证 明 有 资格 从 事 医疗 工作 的 情况 下 就 已 经 完成 了 工作 配对 ， 同 时 ， 如 
果 医 院 提供 的 实习 机 会 没有 被 学 生 接 受 , 那么 再 向 别 的 候选 人 提供 机 会 就 太 晚 了 。 很 显然 ， 这 个 
市 场 没 有 稳定 匹配 ， 于 是 在 19 世纪 50 年代， 美国 启动 了 一 个 名 为 “国家 住院 医生 匹配 项 目 ” 
(NRMP ) 的 计划 ， 旨 在 解决 这 个 问题 。 从 1984 年 开始 ， 阿 尔 文 ， 罗 思 (Alvin Roth ) 在 论文 中 
研究 了 这 个 项 目 使 用 的 算法 并 发 现 了 它 与 Gale-Shapley 算法 原理 类 似 。 他 随 之 假设 出 NRMP 项 
目 成 功 的 根本 原因 就 是 它 使 用 了 稳定 匹配 算法 。 后 来 ， 随 着 女医 生 越 来 越 多 ,情侣 们 在 一 个 地 区 
寻找 实习 机 会 的 现象 越 来 越 普 遍 ， 他 们 可 不 喜欢 NRMP 项 目的 这 套 匹 配 机 制 ， 这 使 得 情侣 们 被 
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很 容易 安排 在 两 个 地 方 , 这 又 引入 了 不 稳定 因素 ， 那 就 是 会 导致 情侣 分 居 两 地 。 于 是 在 1995 年 ， 
罗 思 为 这 个 项 目 设计 了 一 个 新 算法 ， 这 个 新 算法 在 1997 年 被 NRMP 所 采纳 ， 从 那个 时 候 开始 到 
现在 ， 该 算法 每 年 为 超过 2 万 个 医生 找到 了 合适 的 工作 岗位 。 

2012 年 诺 贝 尔 经 济 学 奖 授予 了 两 位 美国 学 者 : 阿尔 文 ， 罗 思 和 劳 埃 德 ， 沙 普 利 ， 以 表彰 他 
们 在 “如 何 让 不 同人 为 了 互惠 互利 而 联系 在 一 起 ”这 个 课题 上 的 出 色 研 究 。 没 错 ， 这 就 是 本 章 介 
绍 的 Gale-Shapley 算法 中 提 到 的 罗 思 和 沙 普 利 ， 他 们 被 称 为 “数理 经 济 学 家 ”。 

Gale-Shapley 算法 又 称 为 “求婚 -拒绝 算法 ”( propose-and-reject algorithm )， 以 舞伴 问题 的 整 
个 求解 过 程 来 看 ,女孩 从 接受 第 一 个 邀请 开始 就 有 了 舞伴 ,并 且 舞 伴 会 越 来 越 好 ， 因 为 女孩 可 以 
根据 自己 的 排序 表 确 定 是 否 选择 更 好 的 舞伴 。 与 此 同时 ,男孩 如 果 被 拒绝 ,他 的 选择 对 象 会 越 来 
越 差 ( 因为 男孩 是 根据 自己 的 排序 表 从 好 到 差 开始 选择 的 )。 然 而 实际 情况 却 并 不 是 这 样 的 ， 
Gale-Shapley 算法 中 “求婚 ”的 一 方 总 是 以 最 佳 可 能 的 稳定 岗 匹配 结束 ， 被 “求婚 ”的 一 方 总 是 
以 最 差 可 能 的 稳定 匹配 结束 ， 因 为 选择 的 主动 权 掌 握 在 “求婚 ”者 手中 。 现 实生 活 中 的 道理 也 是 
如 此 ， 婚 姻 中 男人 如 果 不 主动 争取 , 条 件 好 的 女孩 就 会 投入 别人 的 怀抱 ， 留 给 自己 的 机 会 就 越 来 
越 差 。 学 校 里 那些 勇气 可 嘉 、 敢 于 主动 示爱 的 男生 ， 都 是 学 过 Gale-Shapley 算法 的 ,不 信 你 问 问 
他 们 。 
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第 阐 
爱 因 斯 垢 的 扎 考 题 


这 是 一 个 很 有 趣 的 逻辑 推理 题 , 传说 是 爱 因 斯 坦 提 出 来 的 , 他 宣称 世界 上 只 有 2% 的 人 能 解 
出 这 个 题目 。 传 说 不 一 定 属实 ， 但 是 这 个 推理 题 还 是 很 有 意思 的 。 题 目 是 这 样 的 ， 据 说 有 五 个 
不 同 颜色 的 房间 排 成 一 排 ， 每 个 房间 里 分 别 住 着 一 个 不 同 国籍 的 人 ， 每 个 人 都 喝 一 种 特定 品牌 
的 饮料 ， 抽 一 种 特定 品牌 的 烟 ， 养 一 种 宠物 ,没有 任意 两 个 人 抽 相 同 品牌 的 香烟 ， 或 喝 相 同 品 
牌 的 饮料 ， 或 养 相 同 的 宠物 。 问 题 是 谁 在 养 鱼 作为 宠物 ?为 了 寻找 答案 ， 爱 因 斯 坦 给 出 了 以 下 
15 条 线索 。 
英国 人 住 在 红色 的 房子 里 ; 
瑞典 人 养 狗 作 为 宠物 ; 
丹麦 人 喝 茶 ; 

绿 房子 紧 挨 着 白 房 子 ， 在 白 房 子 的 左边 ; 

. 绿 房子 的 主人 喝 咖啡 ; 

抽 Pall Mall 牌 香烟 的 人 养 乌 ; 

. 黄色 房子 里 的 人 抽 Dunhill 牌 香 烟 ; 

8. 住 在 中 间 那 个 房子 里 的 人 喝 牛 奶 ; 

9. 挪威 人 住 在 第 一 个 房子 里 面 ; 

10. 抽 Blends 牌 香烟 的 人 和 养 猫 的 人 相 邻 ; 

11. 养 马 的 人 和 抽 Dunhill 牌 香烟 的 人 相 邻 ; 

12. 抽 BlueMaster 牌 香烟 的 人 喝 啤 酒 ; 
13. 德国 人 抽 Prince 牌 香 烟 ; 

14. 挪威 人 和 住 在 蓝 房子 的 人 相 邻 ; 
15. 抽 Blends 牌 香烟 的 人 和 喝 矿泉 水 的 人 相 邻 。 


和 


一 1 
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8.1 问题 的 答案 


一 般 人 很 难 同 时 记 住 这 么 多 线索 , 所 以 解决 这 个 问题 需要 用 纸 和 笔画 一 些 表格 , 一 步 一 步 慢 
慢 推 理 ， 必 要 时 需要 一 些 假设 进行 尝试 ， 如 果 假 设 错误 就 推倒 重 来 。 我 缺乏 耐心 去 做 这 个 事情 ， 
所 以 我 一 直 解 不 出 这 个 问题 。 直 到 有 一 天 , 我 的 一 个 聪明 的 朋友 告诉 我 一 个 答案 。 我 对 比 了 一 下 
前 面 提 到 的 15 条 线索 ,发现 这 是 一 个 正确 答案 。 答案 是 住 在 绿色 房子 里 的 德国 人 养 鱼 作为 宠物 ， 
完整 的 推理 结果 如 表 8-1 所 示 。 

我 是 个 懒 人 ,知道 了 这 个 问题 的 答案 也 就 算 了 , 但 是 我 的 朋友 追问 我 一 个 问题 ， 让 我 不 得 不 
正视 这 个 问题 。 我 的 朋友 想 知 道 这 个 问题 的 答案 是 否 唯一 , 会 不 会 有 另外 的 人 推导 出 另 一 个 完全 
不 同 的 答案 。 我 想来 想 去 也 没有 好 的 办 法 证 明 这 个 问题 是 否 还 有 其 他 答案 , 又 懒得 自己 推理 这 个 
问题 ， 只 好 劳 驾 任劳任怨 的 计算 机 来 做 这 个 事情 。 


表 8-1 爱 因 斯 坦 思 考题 推理 结果 


房子 颜色 籍 饮 料 宠 物 烟 
黄色 挪威 水 猫 Dunhill 
蓝 色 丹麦 茶 马 Blends 
红色 英国 牛奶 岛 PallMall 
绿色 德国 咖啡 鱼 Prince 
白色 瑞士 啤酒 狗 BlueMaster 


8.2 分析 问 题 的 数学 模型 


整个 问题 的 描述 分 成 两 部 分 , 一 部 分 是 对 问题 基本 结构 的 描述 ,比如 每 个 人 住 一 种 颜色 的 房 
子 ， 抽 一 种 牌子 的 香烟 ， 喝 一 种 饮料 ， 等 等 。 男 一 部 分 是 对 线索 的 描述 ， 比 如 英国 人 住 在 红色 的 
房子 中 。 如 果 说 基本 数据 结构 只 是 定义 了 推理 结果 的 一 个 框架 , 则 线索 就 可 以 理解 为 不 同属 性 之 
间 的 绑 定 关系 ,用 来 填充 基本 结构 。 因 此 ， 对 本 问题 的 建 模 也 分 成 两 个 部 分 ,一 部 分 是 基本 模型 
定义 ， 妃 一 部 分 是 线索 模型 定义 。 


8.2.1 基本 模型 定义 


这 个 问题 的 描述 比较 复杂 ,总 结 起 来 共有 5 种 颜色 的 房子 、5 种 国籍 、5 种 饮料 、5 种 宠物 和 
5 种 牌子 的 香烟 ， 如 何 用 一 个 数学 模型 同时 表达 这 25 个 属性 呢 ? 这 25 个 属性 分 成 5 种 类 别 ， 仔 
细 观 察 这 些 属性 ， 会 发 现 每 个 属性 都 可 以 用 “类 型 + 值 ”二 元 组 来 描述 。 举 个 例子 ， 房 子 颜色 是 
个 类 型 ， 黄 色 就 是 值 ， 组 合成 “黄色 房子 ”就 是 一 个 属性 。 我 们 首先 将 属性 的 数据 结构 定义 为 : 


typedef struct tagItem 
{ 


ITEM TYPE type; 
int value; 
}ITEM; 


8.2 分析 问题 的 数学 模型 号 97 


ITEM_TYPE 是 个 枚 举 类 型 的 量 ， 可 以 是 房子 颜色 、 国 籍 、 饮 料 类 型 、 宠 物 类 型 和 香烟 牌子 五 
种 类 型 之 一 ，value 是 type 对 应 的 值 。value 的 取 值 范围 是 0 ~4， 根 据 type 的 不 同 ，0 ~ 4 代表 
的 意义 也 不 相同 。 如 果 type 对 应 的 是 房子 颜色 , 则 value 取 值 0 ~ 4 分 别 代表 蓝 色 、 红色 、 绿色 、 
黄色 和 和 白色， 如果 type 对 应 的 是 饮料 类 型 ， 则 value 取 值 0 ~ 4 分 别 代 表 茶 、 水 、 咖 啡 、 啤 酒 和 
牛奶 。 

如 果 任 由 这 25 个 属性 离散 存在 ， 会 给 设计 算法 带 来 困难 ， 一 般 算法 建 模 都 会 用 各 种 数据 结 
构 将 这 些 属 性 组 织 起 来 。 观 察 一 下 表 8-1 给 出 的 推理 结果 ， 我 们 发 现 这 25 个 属性 在 两 个 维度 上 
都 存在 关系 ， 可 以 按照 类 型 组 织 ， 也 可 以 按照 同一 推理 之 间 的 关系 组 织 ， 是 一 个 矩阵 式 关 系 。 根 
据 题 目 描述 ,每 个 人 住 在 一 种 颜色 的 房子 中 ， 喝 一 种 饮料 ， 养 一 种 宠物 ， 抽 一 种 牌子 的 香烟 ， 这 
些 关系 是 固定 的 ， 一 个 人 不 会 同时 养 两 种 宠物 或 喝 两 种 饮料 。 我 们 将 这 种 固定 的 关系 称 为 组 
(group )， 一 个 组 中 包含 一 种 颜色 的 房子 、 一 个 国籍 的 人 、 一 种 饮料 、 一 种 宠物 和 一 种 牌子 的 香 
烟 ， 他 们 之 间 的 关系 是 固定 的 。 既 然 是 这 样 ， 可 以 将 group 数据 结构 设计 为 : 


typedef struct tagGroup 


ITEM items[GROUPS ITEMS]; 
}GROUP; 


这 样 的 设计 中 规 中 和 矩 ， 但 是 会 给 算法 实现 带 来 麻烦 ， 访 问 每 种 属性 都 要 遍历 items， 通 过 每 
个 items 的 type 属性 确定 要 访问 的 类 型 。 比 如 要 查询 或 设置 房子 的 颜色 ， 需 要 遍历 items， 找 到 
items[i].type== type_house 的 那个 属性 进行 操作 。 

在 本 书 中 我 们 多 次 提 到 在 设计 数据 结构 和 算法 是 利用 数组 下 标的 技巧 ， 这 里 又 是 一 个 例子 。 
考虑 到 上 面 的 麻烦 ， 需 要 修改 GROUP 的 设计 ， 不 妨 将 每 种 类 型 在 GROUP 中 的 位 置 固定 ， 然 后 直接 
利用 数据 下 标 进行 访问 。 比 如 将 房子 颜色 类 型 固定 为 数组 第 一 个 元 素 , 将 国籍 固定 为 数组 第 二 个 
元 素 , 以 此 类 推 , 这 样 GROUP 定义 中 可 以 不 需要 属性 的 类 型 信息 ( 类 型 信息 已 经 由 数组 下 标 表达 )， | 
只 需要 一 个 值 信息 即 可 : 


typedef struct tagGroup 


int itemValue[GROUPS ITEMS]; 
}GROUP; 


与 此 同时 ， 需 要 对 ITEM_TYPE 枚 举 类 型 做 值 绑 定 ， 以 便 和 数组 下 标 对 应 ， 绑 定 值 如 下 : 


typedef enum tagItemType 


type_house = 0， 

type_nation = 1， 

type _ drink = 2， 

type_pet = 3， 

type cigaret = 4 
}ITEM TYPE; 


使 用 这 种 定义 数据 结构 的 方式 , 不 仅 可 以 减少 设计 算法 实现 的 麻烦 , 还 可 以 提高 算法 执行 效 
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率 。 比 如 现在 要 查看 一 个 GROUP 绑 定 组 中 房子 的 颜色 是 否 是 蓝 色 ， 就 可 以 这 样 编写 代码 


if(group.itemValue[type_house] == COLOR BLUE) 
8.2.2 ”线索 模型 定义 


接 下 来 考虑 一 下 如 何 对 线索 建立 数学 模型 。 线 索 模 型 的 意义 在 于 判断 一 个 枚 举 结果 是 否 正 
确 ， 如 果 某 个 枚 举 结果 能 够 符合 全 部 15 条 线索 ， 那 这 个 结果 就 是 最 终 的 正确 结果 。 因 此 ， 线 索 
数据 结构 的 定义 非常 关键 ， 如 果 定 义 不 好 , 不 仅 算 法 实现 会 遇 到 很 大 的 麻烦 ， 而 且 影 响 算法 实现 
的 效率 。 即 使 最 后 设计 出 了 算法 实现 ， 也 是 到 处 都 是 长 长 的 if.else 分 支 ， 本 书 中 多 次 强调 ， 代 
码 中 长 长 的 if.else 分 支 结构 意味 着 出 现 了 不 良 设计 。 

先 分 析 一 下 这 15 条 线索 ， 大 致 可 以 分 成 三 类 : 第 一 类 是 描述 某 些 属性 之 间 具 有 固定 绑 定 关 
系 的 线索 ， 比 如 , “丹麦 人 喝 茶 ” 和 “ 住 绿 房子 的 人 喝 咖 啡 ”， 等 等 ,线索 1、2、3、5、6、7、 
12、13 可 归 为 此 类 ; 第 二 类 是 描述 某 些 属性 类 型 所 在 的 “组 ”所 具有 的 相 邻 关系 的 线索 ， 比 如 ， 
“ 养 马 的 人 和 抽 Dunhill 牌 香烟 的 人 相 邻 ”和 “ 抽 Blends 牌 香烟 的 人 和 养 猫 的 人 相 邻 ”"， 等 等 ， 
线索 10、11、14、15 可 归 为 此 类 ; 第 三 类 就 是 不 能 描述 属性 之 间 固 定 关 系 或 关系 比较 弱 的 线 
索 ， 比 如 ,“ 绿 房子 紧 挨 着 白 房子 ， 在 白 房子 的 左边 ”和 “ 住 在 中 间 那 个 房子 里 的 人 喝 牛 奶 ”， 
等 等 。 

对 于 第 一 类 具有 绑 定 关系 的 线索 ， 其 数学 模型 可 以 这 样 定义 : 


typedef struct tagBind 


ITEM TYPE first type; 
int first val; 
ITEM TYPE second type; 
int second val; 

}BIND; 


first type 和 first_val 是 一 个 绑 定 关系 中 前 一 个 属性 的 类 型 和 值 , second type 和 second val 
是 绑 定 关系 中 后 一 个 属性 的 类 型 和 值 。 以 线索 6:“ 绿 房子 的 主人 喝 咖啡 ”为 例 ,first_type 就 是 
type_house，first_ val 就 是 COLOR_GREEN ( COLOR_GREEN 是 个 整数 型 常量 )，second type 就 是 
type drink，second val 就 是 DRINK_ COFFEE ( DRINK COFFEE 是 个 整数 型 常量 ), 线索 1、2、3、5、6、 
7、12、13 就 可 以 存储 在 binds 数组 中 


const BIND binds[] = 
4 


type_house, COLOR RED, type nation, NATION ENGLAND }, 
type_nation, NATION SWEDEND, type pet, PET DOG }, 
type_nation, NATION DANMARK, type drink, DRINK_TEA }, 
type_house, COLOR GREEN, type drink, DRINK COFFEE }, 
type_cigaret, CIGARET PALLMALL, type pet, PET BIRD }, 
type_house, COLOR YELLOW, type cigaret, CIGARET DUNHILL }, 
type_cigaret, CIGARET BLUEMASTER, type drink, DRINK BEER }, 
type_nation, NATION GERMANY, type cigaret, CIGARET PRINCE } 


一 一 一 一 一 一 一 一 


B 
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对 于 第 二 类 描述 元 素 所 在 的 “组 ”具有 相 邻 关系 的 线索 ， 其 数学 模型 可 以 这 样 定义 : 
typedef struct tagRelation 
ITEM TYPE type; 
int val; 
ITEM TYPE relation type; 


int relation val; 
}RELATION; 


type 和 val 是 某 个 “组 ”内 的 某 个 属性 的 类 型 和 值 ，relation_type 和 relation_val 是 与 该 属 
性 所 在 的 “组 ” 相 邻 的 “组 ”中 与 之 有 关系 的 属性 的 类 型 和 值 。 以 线索 10“ 抽 Blends 牌 香烟 的 
人 和 养 猫 的 人 相 邻 ”为 例 ，type 就 是 type_cigaret，val 就 是 CIGARET_BLENDS ( CIGARET_BLENDS 是 
个 整数 型 常量 )，relation_type 是 type_pet，relation_val 是 PET_CAT ( PET_CAT 是 个 整数 型 常量 )。 
线索 10、11、14、15 就 可 以 存储 在 relations 数组 中 : 


const RELATION relations[] = 
{ 


dol 


{ type cigaret, CIGARET BLENDS, type pet, PET_CAT }, 
{ type pet, PET HORSE, type cigaret, CIGARET DUNHILL }, 


{ type_nation, NATION NORWAY, type house, COLOR BLUE }, 
{ type cigaret, CIGARET BLENDS, type drink, DRINK WATER } 


}; 

对 于 第 三 类 线索 , 无 法 建立 统一 的 数学 模型 ， 只 能 在 枚 举 算法 进行 过 程 中 直接 使 用 它们 过 滤 
掉 一 些 不 符合 条 件 的 组 合 结 果 。 比 如 线索 8“ 住 在 中 间 那 个 房子 里 的 人 喝 牛 奶 ”， 就 是 对 每 个 饮 
料 类 型 组 合 结果 直接 判断 groups[2].itemValue[type_drink] 的 值 是 否 等 于 DRINK_MILK, 如 果 不 满足 
这 个 线索 就 不 再 继续 下 一 个 元 素 类 型 的 枚 举 。 再 比如 线索 4“ 绿 房子 紧 挨 着 白 房子 ， 在 白 房子 的 
左边 ”， 就 是 在 对 房子 类 型 进行 组 合 排列 时 ， 将 绿 房子 和 白 房子 看 成 一 个 整体 进行 排列 组 合 的 枚 
举 ， 得 到 的 结果 直接 符合 了 线索 4 的 要 求 。 


8.3 算法 设计 


和 其 他 穷 举 类 算法 一 样 , 本 问题 的 穷 举 算法 也 包含 两 个 典型 过 程 , 一 个 是 对 所 有 结果 的 穷 举 
过 程 , 另 一 个 是 对 结果 的 证 确定 判定 过 程 。 这 两 个 过 程 的 算法 设计 与 之 前 的 数据 结构 设计 息 息 相 
关 ， 丁 就 分 别 介绍 一 下 这 两 个 过 程 的 算法 设计 方法 。 


8.3.1 穷 举 所 有 的 组 合 结果 


前 面 几 章 也 多 次 介绍 穷 举 法 解决 问题 , 但 都 是 一 维 线性 组 合 的 枚 举 ， 本题 则 有 些 特殊 ， 需 要 
对 不 同类 型 的 元 素 分 别 用 穷 举 法 进行 枚 举 , 因此 不 是 简单 的 线性 组 合 。 这 个 算法 采用 的 穷 举 方法 
是 对 不 同类 型 的 元 素 分 别 进行 枚 举 , 然后 再 按照 组 的 关系 组 合 在 一 起 , 这 个 组 合 不 是 线性 关系 的 
组 合 ， 而 是 类 似 阶乘 的 几何 关系 的 组 合 。 具 体 思 路 就 是 按照 group 中 的 元 素 顺 序 ， 首 先 对 房子 根 
据 颜 色 组 合 进行 穷 举 , 每 得 到 一 组 房子 颜色 组 合 后 , 就 在 此 基础 上 对 住 在 房子 里 的 人 的 国籍 进行 


穷 举 ， 在 房子 颜色 和 国籍 的 组 合 结果 基础 上 , 在 对 饮料 类 型 进行 穷 举 ， 以 此 类 推 ， 直 到 穷 举 完 最 
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个 算法 和 普通 的 组 合 穷 举 算法 不 同 , 需要 对 五 种 类 型 的 属性 分 别 枚 举 , 但 是 每 种 类 型 的 枚 
比如 8.2.2 节 描 述 的 第 三 类 线 。 这 类 情况 无 法 统一 处 理 ， 需 要 在 枚 举 算 
法 中 进行 处 理 。 以 枚 举 房子 颜色 的 算法 为 例 ， 这 里 需要 处 理 线索 4“ 绿 房子 紧 挨 着 白 房 子 ， 在 白 
房子 的 左边 ”这 种 特殊 情况 ， 请 看 算法 实现 : 


void EnumHouseColors(GROUP *groups, int groupIdx) 


{ 
if(groupIdx == GROUPS_COUNT) /* 递 归 终 止 条 件 */ 
{ 
ArrangeHouseNations (groups); 
return; 
} 
for(int i = COLOR BLUE; i <= COLOR YELLOW; i++) 
{ 
if(!IsGroupItemValueUsed(groups, groupIdx, type house, i)) 
{ 
groups[groupIdx].itemValue[type house] = i; 
if(i == COLOR_GREEN) // 应 用 线索 (4): 绿 房子 紧 挨 着 白 房 子 ， 在 白 房 子 的 左边 ; 
{ 
groups[++groupIdx].itemValue[type house] = COLOR WHITE; 
EnumHouseColors(groups, groupIdx + 1); 
if(i == COLOR GREEN) 
{ 
groupIdx--; 
} 
} 
} 


这 是 一 个 典型 的 线性 枚 举 ， 只 是 在 枚 举 结束 的 时 候 继续 调用 ArrangeHouseNations() 了 水 数 继续 
对 房间 内 住 的 人 的 国籍 进行 枚 举 。 既 然 绿色 房子 在 白色 房子 左边 , 那么 每 次 枚 举 中 只 要 有 绿色 房 
子 ， 就 直接 将 其 右边 (表现 在 数据 结构 中 就 是 下 一 个 组 索引 ) 的 组 中 的 房子 颜色 设置 成 白色 。 当 
然 , 枚 举 的 范围 就 变 成 从 COLOR_BLUE 到 COLOR_YELLOW 四 种 颜色 ,没有 COLOR_NHITE ,因为 COLOR_NHITE 
和 COLOR_GREEN 两 种 颜色 直接 做 了 绑 定 。 


对 线索 9“ 挪 威 人 住 在 第 一 个 房子 里 面 ”的 特殊 处 理 体 现在 ArrangeHouseNations() 函 数 中 ， 
请 看 ArrangeHouseNations() 函 数 的 实现 ， 非 常 简 单 吧 ， 这 就 是 数据 结构 设计 带 来 的 便利 。 


void ArrangeHouseNations(GROUP *groups) 


/* 应 用 规则 (9): 挪威 人 住 在 第 一 个 房子 里 面 ; 

groups[0].itemValue[type nation] = ed 

EnumHouseNations(groups，1); /* 从 第 二 个 房子 开始 */ 
上 
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依次 完成 5 种 属性 的 枚 举 ， 就 得 到 一 个 类 似 表 8-1 的 完整 组 合 结果 ， 一 共有 多 少 种 这 样 的 组 
合 结果 呢 ? 我 们 来 简单 计算 一 下 。 首 先是 对 房子 颜色 进行 穷 举 。 因 为 是 $ 种 颜色 的 不 重复 组 合 ， 
因此 应 该 有 51= 120 个 颜色 组 合 结果 , 但 是 根据 线索 4“ 绿 房子 紧 挨 着 白 房子 , 在 白 房子 的 左边 ”， 
相当 于 绿 房子 和 白 房子 有 稳定 的 绑 定 关系 ， 实 际 就 只 有 4! = 24 个 颜色 组 合 结果 。 接 下 来 对 24 
个 房子 颜色 组 合 结果 中 的 每 一 个 结果 再 进行 住户 国籍 的 穷 举 ， 理 论 上 国籍 也 有 51 = 120 个 结 
但 是 根据 线索 9“ 挪 威 人 住 在 第 一 个 房子 里 面 "， 相 当 于 固定 第 一 个 房子 住 得 人 始终 是 挪威 人 ， 
因此 就 只 有 4! =24 个 国籍 组 合 结果 。 穷 举 完 房 子 颜 色 和 国籍 后 就 已 经 有 24 x 24 = 576 个 组 合 结 
果 了 , 接 下 来 需要 对 这 576 个 组 合 结果 中 的 每 一 个 结果 再 进行 饮料 类 型 的 穷 举 ,理论 上 饮料 类 型 
也 有 5! = 120 个 结果 ,但 是 根据 线索 8“ 住 在 中 间 那 个 房子 里 的 人 喝 牛 奶 ”， 相 当 于 固定 了 一 个 
饮料 类 型 ， 因 此 也 只 有 4! = 24 个 饮料 组 合 类 型 。 穷 举 完 饮 料 类 型 后 就 得 到 了 576 x 24 = 13824 
个 组 合 结果 , 接 下 来 对 13824 个 组 合 结果 中 的 每 一 个 结果 再 进行 宠物 种 类 的 穷 举 , 这 一 步 没 有 线 
索 可 用 ,共有 5! = 120 个 结果 。 穷 举 完 宠物 种 类 后 就 得 到 了 13824 x 20 = 1658880 个 组 合 结果 ， 
最 后 对 1658880 个 组 合 结果 中 的 每 一 个 结果 再 进行 香烟 品牌 的 穷 举 ， 这 一 步 依然 没有 线索 可 用 ， 
共有 5! = 120 个 结果 。 穷 举 完 香烟 品牌 后 就 得 到 了 全 部 组 合共 1658880 x 120 = 199065600 个 结 
果 。 有 将 近 2 亿 个 组 合 结果 ， 看 来 出 现 多 个 正确 答案 的 可 能 性 很 大 哟 。 


8.3.2 ”利用 线索 判定 结果 的 正确 性 


根据 8.2.2 节 的 分 析 ， 一 共有 三 类 线索 ， 其 中 第 三 类 线索 已 经 融入 到 枚 举 过 程 中 了 ， 因 此 判 
断 结 果 的 正确 性 只 需要 用 第 一 类 线索 和 第 二 类 线索 进行 过 滤 即 可 。 第 一 类 线索 是 同一 GROUP 内 的 
属性 之 间 的 绑 定 关系 ,用 来 描述 的 是 一 个 “组 ”内 两 种 属性 之 间 的 固定 关系 。 对 这 类 线索 的 判断 
的 方法 就 是 遍历 全 部 的 “组 ”， 找 到 BIND 数据 中 的 first_type 和 first_val 标识 的 属性 所 在 的 组 
group， 然 后 检查 group 组 中 类 型 为 second type 的 属性 的 值 是 否 等 于 second val。 如 果 group 中 类 
型 为 second type 对 应 属性 的 值 与 second val 的 值 不 一 致 就 直接 返回 检查 失败 ， 否 则 就 说 明 当 前 
的 组 合 结果 满足 此 BIND 数据 对 应 的 线索 ， 然 后 对 下 一 个 BIND 数据 重复 上 述 检 查 过 程 ， 直 到 检查 
完 binds 数组 中 所 有 线索 对 应 的 BIND 数据 。 图 8-1 是 用 绑 定 关系 线索 对 结果 检查 的 流程 图 。 
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group=FindGroupIdxByItem(binds[i],first -ys 
binds[il],first va 


value=GetGroupItemValue(group, binds[i],second type) 


binds[i],second type == value? 


i=i+1 


设置 检查 失败 标志 


是 否 处 理 完 所 有 binds 线 索 ? 


图 8-1 绑 定 关系 线索 检查 的 流程 图 


第 二 类 线索 是 “组 ”之 间 的 相 邻 关 系 线索 ， 描 述 的 是 相 邻 的 两 个 组 之 间 的 属性 的 固定 关系 ， 
判断 的 方法 就 是 遍历 全 部 的 “组 ” ,找到 RELATION 数据 中 的 type 和 val 标识 的 元 素 所 在 的 组 group， 
然后 分 别 检查 与 group 相 邻 的 两 个 组 〈 第 一 个 组 和 最 后 一 个 组 只 有 一 个 相 邻 的 组 ) 中 类 型 为 
relation type 的 元 素 对 应 的 值 是 否 等 于 relation val， 如 果 相 邻 的 组 中 没有 一 个 能 满足 RELATION 
数据 就 表示 当前 组 合 结果 不 满足 线索 , 直接 返回 检查 失败 。 相 邻 的 组 中 只 要 一 个 组 中 的 元 素 满 足 
RELATION 数据 描述 的 关系 就 表示 当前 组 合 结果 符合 RELATION 数据 对 应 的 线索 ， 需 要 对 下 一 个 
RELATION 数据 重复 上 述 检查 过 程 , 直到 检查 完 relations 数组 中 的 全 部 线索 对 应 的 RELATION 数据 。 
图 8-2 是 用 “组 ” 相 邻 关系 对 结果 检查 的 流程 图 。 
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group = FindGroupIdxByItem(relations[i yp 
relations[i], 


result = CheckGroupRelation(relations[i],relation type， 
relations[i],relation val); 


| 设置 检查 失败 标志 


i=i+1 


是 否 处 理 完 所 有 relations 线 索 ? 


| 设置 检查 成 功 标志 | 
结束 


图 8-2 “组 ” 相 邻 关系 线索 检查 流程 图 | 


根据 图 8-1 和 图 8-2 所 示 的 流程 图 可 以 看 出 ， 对 这 两 类 线索 进行 检查 的 算法 实现 非常 简单 。 
得 益 于 我 们 的 数据 结构 设计 ， 检 查 算法 只 需要 遍历 binds 数组 和 relations 数组 即 可 ， 避 免 了 写 
很 多 if.else 分支 。 这 两 个 检查 的 具体 算法 实现 代码 在 本 书 的 配 书 代码 中 ， 此 处 就 不 再 列 出 。 


8.4 总 结 
虽然 有 将 近 2 亿 个 组 合 结果 , 但 是 令 人 惊讶 的 是 ,竟然 只 有 一 组 结果 能 通过 所 有 的 线索 检查 ， 
就 是 8.1 节 给 出 的 答案 。 结 果 有 了 ， 答案 真 的 是 唯一 的 ， 有 点 出 乎 预料 ， 但 是 也 从 侧面 说 明了 这 
个 问题 的 难度 。 
本 问题 的 穷 举 算法 是 一 个 比较 另类 的 穷 举 算 法 , 可 能 因为 其 结果 是 二 维 关系 的 原因 吧 , 与 之 
前 介绍 的 线性 穷 举 算法 稍 有 不 同 。 通 过 本 算法 ,大 家 可 以 了 解 一 下 多 个 维度 穷 举 的 一 般 方法 ,就 
是 对 每 个 维度 分 别 穷 举 ， 然 后 再 按照 关系 组 合 穷 举 结果 。 
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第 OO 章 


项 目 宫 理 与 多 时 折 扑 排序 


作为 一 个 晚 睡 晚 起 的 典范 ,我 每 天 早上 从 睁 开眼 开始 就 要 在 20 分 钟 时 间 内 完成 以 下 活动 : 
和 起床、 收听 早 间 新 闻 、 穿 衣 、 洗 脸 、 刷 牙 、 吃 早饭 、 穿 鞋 、 出 门 赶 班车 。 这 些 活 动 一 般 按 照 
一 个 合理 的 顺序 依次 进行 ， 有 些 活动 也 可 以 同时 进行 ， 比 如 洗脸 刷牙 的 同时 可 以 听 新 闻 ， 但 
是 我 不 会 一 边 刷 牙 一 边 吃 早 饭 。 再 比如 ， 穿 衣 洗 汶 这 些 活 动 一 般 在 出 门 赶 班车 之 前 完成 ， 妆 
然 我 也 可 以 拿 着 衣服 到 班车 上 穿 ， 但 是 稍微 理智 一 点 我 都 不 会 这 么 做 。 假 如 我 是 一 个 机 器 人 ， 
间 内 按照 合理 的 顺序 完成 这 些 活动 ? 假如 每 个 活动 完成 都 需要 一 
定 的 时 间 ， 比 如 刷牙 需要 3 分 钟 ， 洗 脸 需要 4 分 钟 ， 那 么 如 何 让 我 知道 能 否 在 20 分 钟 内 完成 


谁 能 告诉 我 如 何在 规定 的 时 


这 些 活动 ? 


起 床上 班 这 件 事情 当然 是 一 件 微 不 足 道 的 小 事 , 说 管理 就 未 免 太 夸大 其 入 了 , 但 是 对 于 一 个 
由 众多 活动 组 成 的 项 目 来 说 , 如 何 对 各 种 关系 复杂 的 活动 进行 有 效 的 组 织 , 使 这 些 活动 能 按照 合 


理 的 顺序 逐个 完成 ， 就 不 得 不 提 项 目 管理 。 


大 家 对 项 目 管 理 都 不 陌生 , 无 论 是 大 项 目 还 是 小 项 目 , 最 终 都 可 以 通过 工作 分 解 结构 ( WBS， 
Work Breakdown Structure ) 的 方式 分 解 成 一 系列 的 任务 ， 然 后 再 细 分 为 具体 的 活动 (activity )， 
每 个 活动 对 应 一 个 工作 ， 当 这 些 活动 都 结束 的 时 候 , 项 目 也 就 完成 了 。 项 目 中 的 这 些 活动 都 不 是 
孤立 的 ,它们 之 间 存 在 前 后 依赖 的 关系 。 有 的 活动 没有 先决 条 件 ， 可 以 安排 在 任意 时 间 开 始 ， 有 
的 活动 则 依赖 其 他 活动 ,需要 在 其 依赖 的 活动 都 完成 后 才能 开始 。 面 对 一 堆 关 系 错综复杂 的 活动 ， 


如 何 安排 和 组 织 这 些 活 动 , 让 它们 在 合适 的 时 间 开 始 ， 


最 终 能 在 最 短 的 时 间 内 结束 ,往往 是 项 目 


管理 者 最 头疼 的 事情 。 幸 运 的 是 ， 有 很 多 项 目 管理 软件 帮助 人 们 做 这 些 事情 ,这些 管 理 软件 可 以 
根据 开始 时 间 对 所 有 的 活动 排序 , 根据 这 个 排序 结果 就 可 以 知道 应 该 在 什么 时 间 安 排 开始 什么 活 


动 。 项 目的 执行 周期 也 是 管理 


者 最 关注 的 事情 之 一 ,管理 


者 需要 知道 哪些 活动 最 影响 项 目的 时 间 


进度 ， 项 目 管理 软件 同样 可 以 找 出 项 目 中 所 有 活动 的 关键 路 径 ， 采 住 关键 路 径 上 的 活动 不 延误 ， 


项 目 周期 也 就 有 了 保证 。 


举 个 例子 ,假如 某 工程 分 解 后 得 到 Pi ~ Po 共 9 个 活动 ， 这 些 活动 之 间 的 依赖 关系 如 表 9-1 


所 示 。 
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表 9-1 工程 活动 关系 表 


活动 名 称 时 间 〈 天 ) 依赖 

Pi 8 

了 2 5 

Ps 6 PP2 

Ps 4 P; 

Ps 7 P; 

Pe 7 Pa,Ps 

Py 4 Pi 

Ps 3 Py 

Po 4 Ps,Psg 


将 以 上 活动 输入 到 Microsoft Office 套件 中 的 Project 软件 中 ， 选 择 “ 按 照 开 始 时 间 排 序 ” 功 
能 对 这 些 活动 进行 排序 ， 就 可 以 得 到 各 个 活动 开始 的 依次 顺序 : P1、P,、Ps、P3、P;、Ps、Ps、 
P5、P。。 如 果 选 择 “ 关 键 路 径 ” 功 能 ， 软 件 会 提示 这 个 工程 的 关键 路 径 是 : Pi 一 P; 一 P4 一 P。， 
如 图 9-1 所 示 。 

对 于 整个 工程 项 目 ， 人 们 最 担心 的 是 两 个 问题 ; 一 个 是 工程 是 否 能 顺利 进行 , 另 一 个 是 估算 整 
个 工程 完成 所 需要 的 最 短 时 间 。 如 果 对 整个 功能 的 所 有 活动 排序 ,能 得 到 一 个 没有 环 路 的 活动 序列 ， 
就 说 明 工 程 能 够 顺利 进行 , 同样 ,只 要 找到 了 活动 序列 中 的 关键 路 径 , 就 可 以 估算 出 工程 完工 的 最 
短 时 间 。 你 有 没有 想 过 各 种 项 目 管理 软件 提供 的 这 些 功能 是 如 何 实 现 的 ?其 背后 又 是 什么 样 的 算法 
在 支撑 这 些 功能 ”其 实 很 简单 ,这 些 算法 用 到 了 图 论 中 的 一 些 理论 ,对 于 用 图 表示 的 活动 序列 来 说 ， 


其 对 应 的 操作 就 是 有 向 图 的 拓扑 排序 和 关键 路 径 查 找 ， 本 章 就 来 介绍 这 些 有 趣 的 算法 。 
原始 的 活动 关系 


pa 


关键 路 径 
Pi 


P; 


图 9-1 ”Project 软件 的 “按照 开始 时 间 排 序 ” 和 “关键 路 径 ” 功 能 
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9.1 AOV 网 和 AOE 网 


在 图 论 中 , 如 果 某 个 有 向 图 无 法 从 某 个 顶点 出 发 经 过 若干 条 边 回 到 该 点 , 则 称 这 个 图 为 有 向 
无 环 图 ( Directed Acyclic Graph，DAG )。 有 向 无 环 图 是 描述 工程 或 项 目 进行 过 程 的 有 效 工 具 , 项 
目 分 解 后 所 得 到 的 具体 活动 之 间 的 关系 ， 可 以 用 有 问 无 环 图 表示 , 很 显然 , 这 些 活动 如 果 存 在 构 
成 环 的 顺序 依赖 关系 ， 会 造成 环 中 的 活动 都 无 法 进行 。 

图 的 主要 元 素 是 顶点 和 边 , 用 有 向 无 环 图 表示 工程 活动 之 间 的 关系 时 , 根据 顶点 和 边 所 代表 
的 意义 不 同 , 通常 有 两 种 常见 的 表示 方法 , 分 别 是 AOV 网 和 AOE 网 。 如 果 图 中 顶点 代表 的 是 活 
动 , 有 向 边 代 表 的 是 与 此 边 相 连 的 两 个 活动 的 前 后 关系 , 则 这 样 的 有 向 无 环 图 就 被 称 为 顶点 表示 
活动 网 ( Activity On Vertex network )， 简 称 AOV 网 ，AOYV 网 常用 于 通过 拓扑 排序 决定 活动 开始 
关系 。 图 9-2 就 是 将 表 9-1 中 的 例子 用 AOV 网 表示 的 有 向 无 环 图 。 


d=4，st=8 d=3，st=12 


上 d=7, st=18 


图 9-2 ”由 活动 顶点 组 成 的 AOV 网 


如 果 图 中 边 代 表 的 是 活动 , 边 的 权 表示 完成 活动 所 需要 的 时 间 , 与 边 相 连 的 两 个 顶点 分 别 表 
示 活 动 的 开始 事件 和 结束 事件 ， 则 这 样 的 有 向 无 环 图 就 被 称 为 边 表 示 活 动 网 (Activity On Edge 
network )， 简 称 AOE 网 ，AOE 网 是 一 种 带 权 的 有 向 无 环 图 ，AOE 网 常用 于 估算 工程 完工 时 间 。 
图 9-3 就 是 将 表 9-1 中 的 例子 用 AOE 网 表示 的 有 向 无 环 图 。 Ee 


图 9-3 ”由 事件 顶点 和 活动 边 组 成 的 AOE 网 
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9.2 ”拓扑 排序 


在 图 论 中 , 一 个 有 疝 无 环 图 的 所 有 顶点 可 以 排 成 一 个 线性 序列 ， 当 这 个 线性 序列 满足 以 下 条 
件 时 ， 称 该 序列 为 一 个 满足 图 的 拓扑 次 序 (topological order ) 的 序列 。 
口 图 中 的 每 个 顶点 在 序列 中 只 出 现 一 次 ; 


口 对 于 图 中 任意 一 条 有 向 边 (u,v )， 在 该 序列 中 顶点 wu 一 定位 于 顶点 v 之 前 。 


这 样 的 序列 也 被 称 为 拓扑 序列 ,对 有 向 图 的 所 有 顶点 排序 ,获得 拓扑 序列 的 过 程 就 是 有 向 图 
的 拓扑 排序 ( topological sorting )。 拓 扑 排 序 并 不 仅仅 用 于 有 向 图 ， 它 是 一 种 利用 数据 元 素 中 某 
个 属性 的 偏 序 关系 得 到 数据 元 素 的 全 排序 序列 的 方法 , 本 章 的 内 容 只 关注 基于 有 向 图 的 拓扑 排序 
方法 。 


9.2.1 拓扑 排序 的 基本 过 程 


对 有 向 图 进行 拓扑 排序 可 以 得 到 顶点 的 拓扑 序列 ， 拓 扑 排 序 的 基本 过 程 如 下 : 


(1) 从 有 了 向 图 中 选择 一 个 没有 前 驱 ( 入 度 为 0 ) 的 顶点 ， 输 出 这 个 项 点; 
(2) 从 有 向 图 中 删除 该 项 点， 同时 删除 由 该 顶点 发 出 的 所 有 有 向 边 。 


重复 上 述 步 又 (0D) 和 (2)， 直 到 图 中 不 再 有 入 度 为 0 的 顶点 为 止 。 此 时 ， 如 果 所 有 的 顶点 都 已 
经 输出 ， 则 顺序 输出 的 顶点 序列 就 是 一 个 拓扑 序列 ， 如 果 图 中 还 有 未 输出 的 顶点 ,但 是 入 度 都 不 
为 0， 则 说 明 有 向 图 中 存在 环 路 ， 不 能 进行 拓扑 排序 。 

拓扑 排序 的 现实 意义 在 于 ,如 果 按 照 拓扑 序列 中 的 顶点 次 序 安 排 活动 , 则 在 每 一 项 活动 开始 
的 时 候 , 能 够 保证 它 所 依赖 的 前 驱 活 动 都 已 经 完成 ， 从 而 使 得 整个 工程 可 以 顺序 进行 , 不 出 现 冲 
突 。 需 要 注意 的 是 ， 对 于 一 个 有 向 无 环 图 来 说 ， 有 时 候 不 止 一 个 有 序 的 拓扑 序列 。 以 表 9-1 所 示 
的 工程 活动 为 例 ， 以 下 三 个 序列 都 是 合法 的 拓扑 序列 : 

(PP Ps P3\ Pr Ps\ PP Po 

2) Pi Ps Pr Ps P3\ Ps Pa Poe, Po 

G) PP Ps P71 PP Pa Pe Po 


折 扑 排序 是 根据 活动 节点 进行 的 ， 采 用 AOV 网 的 方式 展示 有 向 图 ， 可 以 更 直观 地 看 出 拓扑 
序列 中 各 个 活动 之 间 的 关系 。 从 图 9-2 中 可 以 看 出 ， 上 述 三 个 拓扑 序列 的 区 别 仅仅 是 P3、P; 和 
PP; 三 个 活动 的 开始 次 序 。 


9.2.2 ”按照 活动 开始 时 间 排 序 

工程 实施 过 程 中 , 人 们 总 是 希望 每 个 活动 尽早 开始 。 对 一 个 工程 的 所 有 活动 进行 拓扑 排序 时 ， 
如 果 能 将 活动 的 最 早 开始 时 间 考 虑 进来 , 让 拓扑 序列 中 的 每 个 活动 都 尽早 开始 , 这 样 的 排序 序列 
对 工程 实施 具有 非常 大 的 实用 性 。Project 软件 中 的 “按照 开始 时 间 排 序 ”就 是 满足 这 种 需求 的 一 
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个 功能 。 这 一 节 我 们 也 仿照 Project 软件 实现 一 个 按照 开始 时 间 对 活动 进行 拓扑 排序 的 算法 。 当 
然 ， 这 背后 其 实 就 是 拓扑 排序 ， 大 家 可 以 体会 一 下 算法 在 实际 生活 中 的 应 用 。 


在 一 个 工程 中 ,每 个 活动 的 开始 时 间 受 前 置 活动 的 约束 , 不 可 能 随时 开始 。 但 是 活动 的 开始 
时 间 可 以 根据 前 置 活动 之 间 的 关系 推算 出 来 ， 具 体 推算 的 方法 如 下 。 


口 如 果 一 个 活动 没有 前 驱 活 动 ， 则 这 个 活动 的 开始 时 间 是 0; 
口 如 果 一 个 活动 有 前 驱 活 动 ， 则 这 个 活动 的 开始 时 间 是 前 驱 活动 的 开始 时 间 和 前 驱 活 动 持 
续 时 间 的 和 ， 如 采 一 个 活动 有 多 个 前 驱 活 动 ， 则 这 个 活动 的 开始 时 间 是 这 些 和 中 最 大 的 


一 个 


广 o 

以 表 9-1 中 的 活动 为 例 ，P1 和 已 没有 前 驱 活动 ， 其 开始 时 间 st=0，P; 的 开始 时 间 是 Pi 的 开 
人 时 间 和 Pi 的 持续 时 间 之 和 ， 即 Pj 的 开始 时 间 st=8。P; 的 开始 受制 于 P 和 P,， 其 开始 时 间 是 
max(8+0, 5+0)， 即 P; 的 开始 时 间 st=8。 最 终 每 个 活动 的 开始 时 间 如 图 9-2 所 示 , 现在 我 们 就 基于 
这 个 开始 时 间 的 对 表 9-1 中 的 活动 进行 拓扑 排序 。 

对 于 AOV 网 ， 用 邻接 表 方 式 定 义 有 向 图 的 数据 是 最 常用 的 方式 ， 对 于 图 9-2 所 表示 的 有 向 
图 ， 用 邻接 表 方 式 定义 的 数据 结构 应 该 如 图 9-4 所 示 。 首 先 定义 图 的 顶点 ， 其 数据 结构 描述 如 下 
所 示 。 


p | rp, | ,| 


st=0 st=8 st=8 | 


P | Pr | P, | 


st=0 st=8 st=5 


st=14 st=18 st=18 


图 9-4 ”图 的 邻接 表 表 达 形 式 
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typedef struct tagVertexNode 
{ 


char *name; ”// 活 动 名 称 

int days; // 完 成 活动 所 需 时 间 

int sTime; // 活 动 最 早 开 始 时 间 

int inCount; ”// 活 动 的 前 驱 节点 个 数 

int adjacent; // 相 邻 活动 的 个 数 

int adjacentNode[MAX_VERTEXNODE]; // 相 邻 活动 列表 (节点 索引 ) 
}VERTEX_ NODE; 


对 于 adjacentNode 属 性 需要 特别 说 明 一 下 ,这 个 列表 中 存储 的 是 邻接 顶点 在 图 中 的 节点 索引 ， 
如 果 图 采用 数组 方式 组 织 所 有 的 项 点 , 则 这 个 表 中 存储 的 就 是 邻接 顶点 在 数组 中 的 位 置 (数组 下 
标 ) 图 的 定义 如 下 : 


typedef struct tagaraph 
{ 


int count; // 图 的 顶点 个 数 

VERTEX_ NODE 
vertexs[MAX VERTEXNODE]; // 图 的 顶点 列表 
}GRAPH; 


根据 9.2.1 节 介 绍 的 基本 拓扑 排序 过 程 ， 有 两 个 细节 需要 算法 特殊 处 理 ， 其 一 是 同一 时 刻 有 
多 个 人 度 为 0 的 顶点 的 情况 如 何 处 理 , 其 二 是 删除 一 个 顶点 发 出 的 所 有 有 向 边 后 对 新 产生 的 入 度 
为 0 的 顶点 如 何 处 理 。 基 本 排序 过 程 对 这 些 情况 不 做 任何 特殊 处 理 , 也 就 是 说 对 于 同时 出 现 的 入 
度 为 0 的 顶点 ,以 任何 次 序 输出 都 是 合法 的 。 但 是 如 果 考 虑 开始 时 间 属 性 ， 就 需要 对 这 些 和 人 度 为 
0 的 顶点 按照 开始 时 间 排 序 ， 才 能 保证 最 后 输出 是 按照 开始 时 间 拓 扑 排序 的 结果 。 


按照 基本 拓扑 排序 要 求 ， 同 时 出 现 的 入 度 为 0 的 顶点 要 按照 “先进 先 出 ”的 原则 进行 处 理 ， 
同时 ,还 要 能 够 根据 开始 时 间 排 排序 。 针 对 这 种 情况 ,使 用 “优先 级 队列 ”管理 算法 处 理 过 程 中 
同时 出 现 的 入 度 为 0 的 顶点 就 是 一 个 最 好 的 选择 。 这 些 顶 点 首先 按照 出 现 的 先后 次 序 人 队 ,， 同时 
根据 开始 时 间 调 整 在 队列 中 的 位 置 ， 保 证 开始 时 间 较 小 的 顶点 能 先 于 开始 时 间 较 大 的 项 点 输出 。 

正如 Topologicalsorting() 函 数 代码 所 展示 的 那样 ， 整 个 排序 算法 的 核心 就 是 对 这 个 “优先 
级 队列 ”的 处 理 。 算 法 的 第 一 步 就 是 遍历 有 向 图 的 所 有 顶点， 将 所 有 人 度 为 0 (inCount 值 为 0 ) 
的 顶点 入 队 ， 这 一 步 完成 以 后 优先 级 队列 中 的 两 个 元 素 是 P 和 忆 两 个 顶点 。 算 法 的 第 二 部 分 就 
是 围绕 这 个 优先 级 队列 进行 处 理 ， 首 先 出 队 的 是 Pl， 同时 删除 忆 发 出 的 两 条 有 向 边 ， 删 除 有 向 


入 度 为 0， 因 此 户 加 入 队列 ， 因 为 Py 的 开始 时 间 是 8， 因此 Pj; 排 在 P, 之 后 ， 此 时 队列 中 剩 下 的 
两 个 元 素 分 别 是 P, 和 Pj。 第 二 轮 队 列 处 理 时 ，P; 出 队 ， 同 时 删除 忆 发 出 的 两 条 有 向 边 ， 这 会 导 
致 P3 和 Ps 两 个 顶点 的 入 度 为 0，P3 和 Ps 分别 入 队 ， 但 是 P; 的 开始 时 间 是 5, 小 于 Py 和 Py 的 8， 
P; 排 在 队列 的 最 前 面 ， 此 时 队列 中 的 元 素 分 别 是 Ps;，P; 和 Pj。 重复 以 上 过 程 ， 直 到 队列 为 空 时 
算法 结束 ， 此 时 判断 输出 的 排序 列表 sortedNode， 如 果 sortedNode 中 的 节点 个 数 与 图 的 顶点 个 数 
相同 ， 则 说 明 所 有 顶点 都 已 经 输出 ,拓扑 排序 完成 ， 否 则 就 说 明 图 中 存在 环 路 ,无 法 进行 拓扑 排 
序 。 拓 扑 排 序 的 代码 实现 如 下 所 示 。 
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bool TopologicalSorting(GRAPH *g, std::vector<int>& sortedNode) 
std: :priority queue<QUEUE ITEM> nodeQueue; 
for(int i = 0; i < g->count; i++) 
{ 


if(g->vertexs[i].inCount == 0) 


EnQueue(nodeQueue, i, g->vertexs[i].sTime); 


} 
} 
while(nodeQueue.size() != 0) 
{ 


int node = DeQueue(nodeQueue); // 按 照 开 始 时 间 优 先 级 出 队 
sortedNode.push back(node);// 输 出 当前 节点 

// 遍 历 节 点 node 的 所 有 邻接 点 ， 将 表示 有 向 边 的 inCount 值 减 1 
for(int j = 0; j < g->vertexs[node].adjacent; j++) 


int adjNode = g->vertexs[node].adjacentNode[j]; 
g->vertexs[adjNode].inCount--; 

// 如 果 inCount 值 为 0， 则 该 节点 入 队列 
if(g->vertexs[adjNode].inCount == 0) 


EnQueue(nodeQueue, adjNode, g->vertexs[adjNode].sTime); 
} 
} 
} 


return (sortedNode.size() == g->count); 
} 
根据 表 9-1 的 活动 数据 构造 有 向 图 , 然后 调用 TopologicalSorting() 消 数 得 到 按照 时 间 排 序 的 
活动 拓扑 序列 ， 与 Project 软件 输出 的 排序 结果 一 致 。 需 要 说 明 一 点 ,使 用 TopologicalSorting() 
函数 之 前 需要 手工 计算 好 每 个 节点 的 最 早 开 始 时 间 ， 最 早 开始 时 间 的 自动 计算 算法 ， 将 在 9.3 节 


介绍 。 
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前 面 提 到 过 ,对 于 工程 管理 ， 人 们 最 关注 的 两 个 问题 分 别 是 工程 是 否 能 顺利 进行 ,以 及 估算 
整个 工程 完成 所 需要 的 最 短 时 间 和 影响 工程 时 间 的 关键 活动 。 前 一 个 问题 可 用 拓扑 排序 解决 , 后 
一 个 问题 则 需要 找 出 工程 进行 的 关键 路 径 , 关键 路 径 上 的 活动 完成 所 需要 的 时 间 就 是 工程 完成 所 
需要 的 最 短 时 间 。 关 键 路 径 通 常 是 所 有 工程 活动 中 最 长 的 路 径 , 关键 路 径 上 的 活动 如 果 延 期 将 直 
接 导致 工程 延期 。 

利用 AOV 网 表示 有 向 图 ， 可 以 对 活动 进行 拓扑 排序 ， 根 据 排序 结果 对 工程 中 活动 的 先后 顺 
序 做 出 安排 。 但 是 寻找 关键 路 径 ， 信 算 工程 活动 的 结束 时 间 ， 则 需要 使 用 AOE 网 表示 有 向 图 。 
AOE 网 中 用 顶点 表示 事件 ， 有 向 边 表示 活动 ， 边 上 的 权 值 表示 活动 持续 的 时 间 。 只 有 在 某 顶点 
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所 代表 的 事件 发 生 后 ， 从 该 顶点 出 发 的 各 有 向 边 所 代表 的 活动 才能 开始 , 反之 亦 然 ， 只 有 在 指向 
某 一 顶点 的 各 有 向 边 所 代表 的 活动 都 已 经 结束 后 ， 该 顶点 所 代表 的 事件 才能 发 生 。AOE 网 只 有 
一 个 入 度 为 0 的 顶点 〈 源 点 ) 和 一 个 出 度 为 0 的 顶点 〈 汇 点 )， 分 别 代表 开始 事件 和 结束 事件 ， 
其 他 的 项 点 则 表示 两 个 意义 , 其 一 是 此 点 之 前 的 所 有 活动 都 已 经 结束 , 其 二 是 此 点 之 后 的 活动 可 
以 开始 了 。 对 于 表 9-1 所 列举 的 活动 , 用 AOE 网 表示 的 结果 如 图 9-3 所 示 , 其 中 虚线 连接 的 顶点 
表示 两 个 事件 是 同 质 事件 , 也 就 是 说 这 两 个 顶点 代表 相同 的 事件 , 边 的 权 是 0 表示 这 两 个 顶点 之 
间 没 有 活动 。 

计算 关键 路 径 的 算法 需要 根据 AOE 网 的 特征 调整 图 的 数据 结构 定义 ， 本 节 介 绍 的 算法 仍然 
使 用 邻接 表 来 表示 图 ， 但 是 需要 重新 定义 顶点 和 边 的 数据 结构 。 因 为 AOE 网 的 边 代 表 具 体 的 活 
动 ， 需 要 在 数据 结构 中 明确 体现 “ 边 ”的 定义 ， 调 整 后 的 边 和 顶点 的 定义 如 下 所 示 : 


typedef struct tagEdgeNode 
{ 


int vertexIndex; // 活 动 边 终点 顶点 索引 

std::string name; ”// 活 动 边 的 名 称 

int duty; // 活 动 边 的 时 间 (权重 ) 
}EDGE_ NODE; 


typedef struct tagVertexNode 
{ 


int sTime; // 事 件 最 早 开 始 时 间 

int eTime; // 事 件 最 晚 开始 时 间 

int inCount; // 活 动 的 前 驱 节点 个 数 

std: :vector<EDGE NODE> edges; // 相 邻 边 表 
}VERTEX NODE; 


算法 开始 之 前 , 每 个 顶点 的 sTime 被 初始 化 为 0，eTime 被 初始 化 为 一 个 有 效 范 围 之 外 的 最 大 
值 (0x7FFFFFFF )， 算 法 结束 之 后 ，sTime 和 eTime 会 被 计算 为 实际 的 时 间 值 。 


9.3.1 什么 是 关键 路 径 


开始 讨论 关键 路 径 之 前 ， 先 来 介绍 一 下 活动 的 最 早 开始 时 间 和 最 晚 开 始 时 间 。 工 程 中 一 个 
活动 何 时 开始 依赖 于 其 前 驱 活 动 何 时 结束 , 只 有 所 有 的 前 驱 活动 都 结束 后 这 个 活动 才 可 以 开始 ， 
前 驱 活 动 都 结束 的 时 间 就 是 这 个 活动 的 最 早 开 始 时 间 。 与 此 同时 ， 在 不 影响 工程 完工 时 间 的 前 
提 下 ， 有 些 活动 的 开始 时 间 存 在 一 些 余 量 ， 在 时 间 余 量 允许 的 范围 之 内 推迟 一 段 时 间 开 始 活动 
也 不 会 影响 工程 的 最 终 完 成 时 间 ， 活 动 的 最 早 开 始 时 间 加 上 这 个 时 间 余 量 就 是 活动 的 最 晚 开 始 
时 间 。 活 动 不 能 在 最 早 开始 时 间 之 前 开始 ， 当 然 ， 也 不 能 在 最 晚 开 始 时 间 之 后 开始 ， 否 则 会 导 
致 工期 延误 。 

如 果 一 个 活动 的 时 间 余 量 为 0， 即 该 活动 的 最 早 开始 时 间 和 最 晚 开 始 时 间 相 同 ， 则 这 个 活动 
就 是 关键 活动 ,由 这 些 关键 活动 串 起 来 的 一 个 工程 活动 路 径 就 是 关键 路 径 。 根 据 关键 路 径 的 定义 ， 
一 个 工程 中 的 关键 路 径 可 能 不 止 一 个 , 我 们 常 说 的 关键 路 径 指 的 是 工程 时 间 最 长 的 那 条 路 径 , 也 
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9.3.2 ”计算 关键 路 径 的 算法 


根据 9.3.1 节 的 介绍 ， 计 算 关 键 路 径 的 基础 是 先 找 出 工程 中 的 所 有 关键 活动 ， 确 定 一 个 活动 
是 否 是 关键 活动 的 依据 就 是 活动 的 最 早 开 始 时 间 和 最 晚 开 始 时 间 , 因此 需要 先 介 绍 如 何 计 算 活动 
的 最 早 开 始 时 间 和 最 晚 开始 时 间 。 在 AOE 网 中 ,事件 6; 必 须 在 指向 6 的 所 有 活动 都 结束 后 才能 
发 生 , 只 有 6 发 生 之 后 ,从 6 发 出 的 活动 才能 开始 ， 因 此 6; 的 最 早 发 生 时 间 就 是 6; 发 出 的 所 有 活 
动 的 最 早 开始 时 间 。 如 果 用 est 中 表示 事件 6; 的 最 早 开 始 时 间 ， 用 duty[iy] 表 示 连 接 事件 e; 和 事件 
6 的 活动 需要 持续 的 时 间 ， 则 事件 6; 的 最 早 开始 时 间 可 以 用 以 下 关系 推算 : 

(1) est[0] =0 

(2) est[n] = max {est[i]+duty[i,n], est[7]+duty[j,n], **…, est[k]+duty[k,n]} 


(其 中 7… ,kK 是 事件 的 前 驱 事 件 ) 
根据 以 上 推算 关系 ,可 以 将 图 9-3 中 的 eo ~ 6; 儿 个 事件 的 最 早 开 始 时 间 推 算出 来 : 


est[0]=0 
est[1] = est[0]+duty[0,1] = 0+8 = 8 
est[2] = est[0]+duty[0,2] = 0+5 = 5 
est[3] = max {est[1]+duty[1,3], est[2]+suty[2,3]} = max{8+0, S+0 = 8 
很 显然 , 这 个 推算 关系 是 建立 在 合法 的 拓扑 序列 的 基础 上 的 ， 因此 ,推算 事件 的 最 早 开 始 时 
间 需 要 对 图 中 的 事件 节点 进行 拓扑 排序 。 拓 扑 排序 的 算法 已 经 在 9.2 节 介 绍 过 了 ， 现 在 我 们 只 关 
注 最 早 开始 时 间 的 计算 方法 。 假 设 sortedNode 参数 中 存放 的 图 的 拓扑 排序 结果 ，CcalcESTime() 函 
数 从 拓扑 序列 的 第 一 个 顶点 开始 (变量 u 代表 的 顶点 )， 遍历 这 个 顶点 发 出 的 有 向 边 指向 的 相 邻 
顶点 (变量 v 代表 的 顶点 )， 如 果 该 项 点 的 最 早 开始 时 间 与 有 向 边 代表 的 活动 持续 时 间 的 和 ( 这 
个 结果 存放 在 临时 变量 uvst 中 ) 大 于 有 向 边 指向 的 相 邻 顶点 的 最 早 开 始 时 间 ， 则 更 新 这 个 相 邻 
顶点 的 最 早 开 始 时 间 。 需 要 注意 的 是 ， 算 法 并 没有 直接 利用 推算 关系 中 的 max 选择 处 理 ， 而 是 
按照 sortedNode 序列 中 的 顶点 先后 关系 ,只 在 处 理 到 相 邻 顶点 时 才 更 新 最 早 开始 时 间 ( 这 正 是 所 
有 顶点 的 sTime 被 初始 化 成 0 的 原因 ), 当 sortedNode 序列 中 的 所 有 顶点 都 处 理 完 之 后 , 就 相当 于 9 
变相 地 实现 了 max 选择 的 处 理 。 
void CalcESTime(GRAPH *g, const std: :Vector<int>& sortedNode) 


g->vertexs[0].sTime = 0; //est[0] = 0 


std::vector<int>::const iterator nit = sortedNode.begin(); 

for(; nit != sortedNode.end(); ++nit) 

{ 
int U = *nit; 
// 人 遍历 U 出 发 的 所 有 有 向 边 
std: :vector<EDGE NODE>::iterator eit = g->vertexs[ul].edges.begin(); 
for(; eit != g->vertexs[u].edges.end(); ++eit) 


int v = eit->vertexIndex; 


114 了 第 9 章 项 目 管理 与 图 的 拓扑 排序 


int uvst = g->vertexs[u].sTime + eit->duty; 
if(uvst > g->vertexs[v].sTime) 


{ 


g->vertexs[v].sTime = uvst; 


} 
} 
} 


事件 6; 的 最 晚 开始 时 间 定 义 为 : 6; 的 后 继 事 件 6 的 最 晚 开 始 时 间 减 去 6; 和 之 间 的 活动 的 持 
续 时 间 的 差 ， 当 e: 有 多 个 后 继 事件 时 ， 则 取 这 些 差 值 中 最 小 的 一 个 作为 6; 的 最 晚 开始 时 间 。 如 果 
用 1st[] 表 示 事 件 6 的 最 晚 开 始 时 间 , 用 duty[i, 有 四 表示 事件 6; 和 后 继 事 件 6 之 间 的 活动 需要 持续 的 
时 间 ， 则 事件 6; 的 最 晚 开 始 时 间 可 以 用 以 下 关系 推算 : 


(1) lst[n| = est[n] 
(2) est[i] = min{1st[7]—duty[iy], est[k]—duty[i,k], *…, est[m]—duty[i,m]} 


(其 中 jh…,m 是 事件 i 的 后 继 事件 ) 
仍然 以 图 9-3 为 例 ， 我 们 推算 一 下 es;s、e;、es 和 eo 几 个 事件 的 最 晚 开 始 时 间 : 


lst[9] = est[9] = 25 

lst[5] = lst[9]-duty[5,9] = 25-7= 18 

lst[7] = lst[9]-duty[7,9] = 2S-4= 21 

lst[8] = min {1st[7]—duty[8,7], lst[5]-duty[8.5]》 = min{21-0, 18-0} = 18 

这 个 最 晚 开始 时 间 的 推算 关系 是 建立 在 合法 的 拓扑 序列 的 逆序 基础 上 的 ，CalcLsTime() 王 数 
对 sortedNode 序列 的 处 理 顺 序 和 CalcESTime() 函 数 刚好 相反 ， 从 拓扑 序列 的 最 后 一 个 顶点 (变量 
u 代 表 的 顶点 ) 开始 向 前 遍历 。 如 果 该 顶点 的 后 继 顶 点 〈 变 量 v 代表 的 顶点 ) 的 最 晚 开 始 时 间 与 
连接 这 两 个 顶点 的 活动 的 持续 时 间 的 差 小 于 该 项 点 〈u 顶点 ) 的 最 晚 开 始 时 间 ， 则 更 新 该 项 点 的 
最 晚 开 始 时 间 。 和 CalcESTime() 函 数 一 样 ，CalcLSTime() 函数 也 没有 直接 利用 min 选择 处 理 , 但 是 
通过 逆序 遍历 sortedNode 序列 中 的 所 有 项 点， 变相 地 实现 了 min 选择 的 处 理 。 

void CalcLSTime(GRAPH *g, const std: :Vectorcint>& sortedNode) 


// 最 后 一 个 节点 的 最 晚 开 始 时 间 等 于 最 早 开 始 时 间 
g->vertexs[g->count - 1].eTime = g->vertexs[g->count - 1].sTime; 


std: :vector<int>::const reverse iterator cit = sortedNode.rbegin(); 
for(; cit != sortedNode.rend(); ++cit) 
{ 
Bah el eh a 
// 人 遍历 U 出 发 的 所 有 有 向 边 
std::vector<EDGE NODE>::iterator eit = g->vertexs[u].edges.begin(); 
for(; eit != g->vertexs[u].edges.end(); ++eit) 
{ 
int v = eit->vertexIndex; 
int uvet = g->vertexs[v].eTime - eit->duty; 
if(uvet < g->vertexs[u].eTime) 


{ 


g->vertexs[u].eTime = uvet; 


} 
} 
} 
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在 AOE 网 中 计算 好 每 个 顶点 代表 的 事件 的 最 早 开 始 时 间 和 最 晚 开始 时 间 之 后 ， 就 可 以 很 容 


易 计 算出 每 条 边 代 表 的 活动 的 最 早 开 始 时 间 和 最 晚 开 始 时 间 。 假 如 某 个 活动 两 端的 事件 分 别 是 
ei 和 e;， 则 该 活动 的 最 早 开 始 时 间 就 是 事件 “的 最 早 开始 时 间 ， 该 活动 的 最 晚 开始 时 间 就 是 事件 
6 的 最 晚 开 始 时 间 减 去 该 活动 的 持续 时 间 。 用 这 个 关系 计算 出 所 有 活动 的 最 早 开始 时 间 和 最 晚 开 


台 时 间 ， 只 要 最 早 开始 时 间 和 最 晚 开始 时 间 相 同 的 活动 都 是 关键 活动 , 按照 事件 项 点 的 拓扑 序列 
的 先后 关系 ， 顺 序 输出 这 些 事件 项 点 相关 的 关键 活动 ， 得 到 的 关键 活动 序列 就 是 关键 路 径 。 


综合 前 面 的 分 析 ， 计 算 关键 路 径 的 需要 以 下 


四 个 步骤 。 


(1) 对 事件 顶点 进行 拓扑 排序 ， 得 到 事件 的 拓扑 序列 ; 


(2) 计算 事件 顶点 的 最 早 开始 时 间 
(3) 计算 事件 顶点 的 最 晚 开始 时 间 


(4) 计算 活动 的 最 早 开始 时 间 和 最 晚 开始 时 间 ， 并 按照 事件 的 拓扑 顺序 逐次 输出 关键 活动 ， 


得 到 关键 路 径 。 


这 四 个 步骤 非常 清晰 地 体现 在 CriticalPath() 函 数 中 ， 重 点 是 第 四 个 步 又 输出 关键 路 径 。 判 
断 活动 是 否 是 关键 活动 是 通过 这 行 if 语句 实现 的 : 


if(g->vertexs[u].sTime == g->vertexs[v].eTime - 


eit->duty) 


但 是 要 实现 按照 活动 顺序 输出 关键 活动 路 径 的 功能 , 还 需要 按照 事件 项 点 拓扑 排序 的 结果 逐 


个 判断 每 个 事件 发 出 的 活动 ( 就 是 事件 项 点 发 出 


的 有 向 边 )， 按 照 活动 的 开始 次 序 逐 个 输出 关键 


活动 。 CriticalPath() 消 数 中 的 第 一 个 for 循环 就 是 按照 拓扑 排序 的 结果 逐个 处 理事 件 顶 点 , 第 二 
个 for 循环 就 是 搜索 一 个 顶点 的 所 有 有 向 边 ， 查 找 关 键 活 动 。 需 要 注意 的 是 ， 图 9-3 中 虚线 画 出 


的 边 是 实际 不 存在 的 虚拟 活动 ， 虽 然 不 影响 结果 


， 但 是 也 会 被 当成 关键 活动 输出 ， 因 此 需要 判断 


一 下 ， 如 果 是 虚拟 活动 则 需要 过 滤 一 下 。CriticalPath() 函 数 在 输出 关键 路 径 时 没有 做 过 滤 处 理 ， 
过 滤 的 方法 其 实 也 很 简单 ， 根 据 name 是 否 为 空 或 活动 时 间 是 否 是 0 都 可 以 作为 判断 过 滤 的 依据 ， 


有 兴趣 的 读者 可 自行 完成 。 
bool Criticalpath(GRAPH *g) 
{ 


std: :vector<int> sortedNode; 


if(!TopologicalSorting(g，sortedNode)) // 步 骤 1 


{ 


return false; 


CalcESTime(g，sortedNode); // 步 骤 2 
CalcLSTime(g，sortedNode); // 步 骤 3 
// 步 骤 4: 输出 关键 路 径 上 的 活动 名 称 


std: :vector<int>::iterator nit = sortedNode.begin(); 


116 了 第 9 章 项 目 管理 与 图 的 拓扑 排序 


for(; nit != sortedNode.end(); ++nit) 


Tnt :senit, 
std::vector<EDGE NODE>::iterator eit = g->vertexs[u].edges.begin(); 
for(; eit != g->vertexs[u].edges.end(); ++eit) 


int v = eit->vertexIndex; 
if(g->vertexs[u].sTime == g->vertexs[v].eTime - eit->duty) 


std::cout «< eit->name << std::endl; 
上 
} 


return true; 
} 
对 于 表 9-1 的 活动 关系 数据 ， 转 化 成 AOE 网 形式 的 有 向 图 之 后 , 用 CriticalpPath() 函 数 计算 
出 的 关键 路 径 是 P1 一 Py 一 Ps 一 Pe, 与 Project 软件 计算 出 的 关键 路 径 结果 是 一 样 的 。 我 们 用 自己 写 
的 算法 实现 了 一 样 的 功能 ， 这 些 软 件 也 是 使 用 相同 的 算法 ， 并 无 太 多 神秘 可 言 。 


9.4 ”总结 


现在 回 到 本 章 章 首 的 那个 例子 ， 一 组 没有 任何 关系 的 活动 ， 在 一 定 的 规则 或 常识 的 约束 下 ， 
在 活动 的 某 个 属性 (开始 时 间 ) 上 形成 了 或 弱 或 强 的 顺序 关系 ， 这 就 是 一 个 偏 序 , 在 这 个 偏 序 上 
排序 得 到 的 一 个 全 序 就 是 这 组 活动 的 拓扑 排序 。 这 种 偏 序 关 系 的 强 弱 取 决 于 规则 和 约束 力 的 大 
小 , 正常 情况 下 穿 衣 服 应 该 在 坐班 车 之 前 发 生 , 但 是 我 也 可 以 选择 在 班车 上 穿 衣服 。 当 然 ， 这 取 
决 于 我 失去 理智 的 程度 。 

生活 中 有 很 多 看 似 神 奇 但 是 原理 却 很 简单 的 东西 ,本 章 介绍 的 两 个 算法 就 是 这 样 , 工程 管理 
软件 中 最 实用 的 两 个 功能 ， 原 来 就 是 两 个 简单 的 算法 在 背后 支撑 其 实现 。 很 多 软件 ,无 论 是 动 辑 
几 百 兆 字 节 的 大 型 软件 , 还 是 几 十 千 字 节 的 小 程序 , 背后 都 是 不 同 的 算法 在 支撑 其 展示 的 各 种 功 
能 ,没有 任何 神秘 可 言 ， 本 章 给 出 的 例子 只 是 这 类 软件 功能 的 冰山 之 一 角 黑 了 。 

这 两 个 算法 用 到 了 图 、 数 组 和 带 优先 级 标记 的 队列 等 数据 结构 , 灵活 地 运用 这 些 数据 结构 给 
算法 实现 带 来 了 极 大 的 便利 ,比如 , 普通 的 拓扑 排序 和 本 章 给 出 的 按照 开始 时 间 排 序 在 算法 结构 
上 完全 一 样 ， 的 区 别 就 是 使 用 带 优 先 级 标记 的 队列 代 蔡 普通 的 队列 。 
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第 7 CI 章 
RLE 压缩 算法 与 PCX 图 像 文件 格式 


RLE ( Run Length Encoding ) 压缩 算法 即行 程 长 度 压 缩 算法 ， 也 称 游程 长 度 压缩 算法 ， 是 最 
时 出现、 也 是 最 简单 的 无 损 数据 压缩 算法 。RLE 压缩 算法 对 于 黑白 图 像 和 基于 调 色 板 的 单调 图 像 
有 很 高 的 压缩 效率 ， 不 仅 常 用 于 处 理 图 像 数据 ， 在 传真 机 上 也 得 到 了 广泛 的 应 用 。 


10.1 RLE 压缩 算法 


RLE 斥 缩 算法 (下 简称 RLE 算法 ) 的 基本 思路 是 把 数据 按照 线性 序列 分 成 两 种 情况 : 一 种 
是 连续 的 重复 数据 块 , 另 一 种 是 连续 的 不 重复 数据 块 。RLE 算 法 的 原理 就 是 用 一 个 表示 块 数 的 属 
性 加 上 一 个 数据 块 代表 原来 连续 的 若干 块 数据 ， 从 而 达到 节省 存储 空间 的 目的 。 一 般 RLE 算法 
都 选择 数据 块 的 长 度 为 1 字 节 ， 表示 块 数 的 属性 也 用 1 字 节 表示 ,， 对 于 颜色 数 小 于 256 色 的 图 像 
文件 或 文本 文件 ， 块 长 度 选 择 1 字 节 是 比较 合适 的 。 


10.1.1 连续 重复 数据 的 处 理 


RLE 算法 有 很 多 优化 和 改进 的 变种 算法 ,这 些 算法 对 连续 重复 数据 的 处 理 方式 基本 上 都 是 一 
样 的 。 对 于 连续 重复 出 现 的 数据 ,RLE 算法 一 般 用 两 字 节 表示 原来 连续 的 多 字 节 重复 数据 。 我 们 
用 一 个 例子 更 直观 地 说 明 RLE 算法 对 这 种 情况 的 处 理 ， 假 如 原始 数据 有 5 字 节 的 连续 数据 : 

[data] [data] [data] [data] [datal] 

则 压缩 后 的 数据 就 包含 块 数 和 [data] 两 字 节 ， 其 中 [data] 只 存储 了 一 次 ， 节 省 了 存储 空间 : 

[5] [data] 

需要 注意 的 是 ,一 般 RLE 算法 都 采用 插入 一 个 长 度 属 性 字 节 存储 连续 数据 的 重复 次 数 ， 
此 能 够 表达 的 最 大 值 就 是 255 字 节 ， 如 果 连 续 的 相同 数据 超过 255 字 节 时 ,就 从 第 255 字 节 处 断 
开 ， 将 第 256 字 节 以 及 256 字 节 后 面 的 数据 当成 新 的 数据 处 理 。 随 着 RLE 算法 采用 的 优化 方式 
不 同 , 这 个 长 度 属性 字 节 所 表达 的 意义 也 不 同 , 对 于 本 章 给 出 的 这 种 优化 算法 ,长 度 属性 字 节 的 
最 高 位 被 用 来 做 一 个 标志 位 ， 只 有 7 位 用 来 表示 长 度 ， 这 一 点 在 下 一 节 会 具体 说 明 。 
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10.1.2 ”连续 非 重复 数据 的 处 理 


对 于 连续 的 非 重复 数据 , RLE 算法 有 两 种 处 理 方法 , 一 种 处 理 方法 是 将 每 个 不 重复 的 数据 当 
作 只 重复 一 次 的 连续 重复 数据 处 理 , 在 算法 实现 上 就 和 处 理 连 续 重复 数据 一 样 ; 另 一 种 处 理 方法 
是 不 对 数据 进行 任何 处 理 , 直接 将 原始 数据 作为 压缩 后 的 数据 存储 。 假 如 有 以 下 5 字 节 的 连续 非 
重复 数据 : 
data1] [data2] [data3] [data4] [data5] 
按照 第 一 种 处 理 方法 ， 最 后 的 压缩 数据 就 如 下 所 示 : 
1][data 1][data2] [1][data3] [1][data4] [1][data5] 
如 果 按 照 第 二 种 处 理 方法 ， 最 后 的 数据 和 原始 数据 一 样 : 
data1] [data2] [data3] [data4] [data5] 

如 果 采 用 第 一 种 方式 处 理 连续 非 重复 数据 , 则 存在 一 个 致命 的 问题 , 对 连续 出 现 的 不 重复 数 
据 , 会 因为 插入 太 多 块 数 属性 字 节 而 膨胀 一 倍 ， 如 果 原 始 数据 主要 是 随机 的 非 重复 数据 ,， 则 采用 
这 种 方式 不 仅 不 能 起 到 压缩 数据 的 目的 ， 反 而 起 到 恶化 的 作用 。 多 数 经 过 优化 的 RLE 算法 都 会 
选择 使 用 第 二 种 方式 处 理 连 续 非 重复 数据 ， 但 是 这 就 引入 了 新 间 题 ， 在 RLE 算法 解码 的 时 候 ， 
如 何 区 分 连续 重复 和 非 重复 数据 ? 


前 面 已 经 提 到 ,如 果 把 非 重 复数 据 当 作 独 立 的 单 次 重复 数据 处 理 ， 反 和 而 会 造成 数据 膨胀 , 但 
是 如 果 把 连续 非 重复 数据 也 当成 一 组 数据 整理 考虑 呢 ? 这 是 一 个 优化 的 思路 , 首先 , 给 连续 重复 
数据 和 连续 非 重复 数据 都 附加 一 个 表示 长 度 的 属性 字 节 , 并 利用 这 个 长 度 属 性 字 节 的 最 高 位 来 区 
分 两 种 情况 。 长 度 属性 字 节 的 最 高 位 如 果 是 1， 则 表示 后 面 紧 跟 的 是 个 重复 数据 ， 需 要 重复 的 次 
数 由 长 度 属性 字 节 的 低 7 位 〈 最 大 值 是 127 ) 表示 。 长 度 属性 字 节 的 最 高 位 如 果 是 0， 则 表示 后 
面 紧 跟 的 是 非 重复 数据 ， 长 度 也 由 长 度 属性 字 节 的 低 7 位 表示 。 

采用 这 种 优化 方式 ,压缩 后 的 数据 非常 有 规律 ， 两 种 类 型 的 数据 都 从 长 度 属性 字 节 开始 , 除 
了 标志 位 的 不 同 , 后 跟 的 数据 也 不 同 。 第 一 种 情况 后 跟 一 个 字 节 的 重复 数据 , 第 二 种 情况 后 跟 的 
是 若干 个 字 节 的 连续 非 重 复数 据 。 


10.1.3 ”算法 实现 


首先 介绍 一 下 数据 压缩 的 编码 过 程 如 何 实现 。 采 用 10.1.2 节 给 出 的 优化 方式 , 编码 算法 不 仅 
要 能 够 识别 连续 重复 数据 和 连续 非 重复 数据 两 种 情况 ， 还 要 能 够 统计 出 两 种 情况 下 数据 块 的 长 
度 。 编码 算法 从 原始 数据 的 起 始 位 置 开始 向 后 搜索 , 如 果 发 现 后 面 是 重复 数据 且 重 复 次 数 超过 2 ， 
则 设置 连续 重复 数据 的 标志 并 继续 向 后 查找 , 直到 找到 第 一 个 与 之 不 相同 的 数据 为 止 , 将 这 个 位 
置 记 为 下 次 搜索 的 起 始 位 置 , 根据 位 置 差 计算 重 复 次 数 , 最 后 长 度 属性 字 节 以 及 一 个 字 节 的 原始 
重复 数据 一 起 写 入 压缩 数据 ; 如 果 后 面 数 据 不 是 连续 重复 数据 , 则 继续 向 后 搜索 查找 连续 重复 数 
据 ， 直 到 发 现 连续 重复 的 数据 且 重 复 次 数 大 于 2 为止, 然后 设置 不 重复 数据 标志 , 将 新 位 置 记 为 


10.1 RLE 压缩 算法 号 119 


下 次 搜索 的 起 始 位 置 ， 最 后 将 长 度 属性 字 节 写 和 压缩 数据 并 将 原始 数据 逐 字 节 复制 到 压缩 数据 。 
然后 从 上 一 步 标记 的 新 的 搜索 起 始 位 开始 ， 一 直 重 复 上 面 的 过 程 ， 直 到 原始 数据 结 


int Rle Encode(unsigned char *inbuf, int inSize, unsigned char *outbuf, int onuBufSize) 


{ 


unsigned char *src = inbuf; 
int i; 

int encSize 
int srcLeft 


0; 
inSize; 


while(srcLeft > 0) 


{ 
int count = 0; 
if(IsRepetitionStart(src，srcLeft)) /* 是 否 连 续 三 个 字 节 数据 相同 ? */ 
{ 
if((encSize + 2) > onuBufSize) /* 输 出 缓冲 区 空间 不 够 了 */ 
{ 
return -1; 
} 
count = GetRepetitionCount(src, srcLeft); 
outbuf[encSize++] = count | Ox80; 
outbuf[encSize++] = *src; 
src += count; 
STCLeft -= count; 
} 
else 
{ 
count = GetNonRepetitionCount(src, srcLeft); 
if((encSize + count + 1) > onuBufSize) /* 输 出 缓冲 区 空间 不 够 了 */ 
{ 
return -1; 
} 
outbuf[encSize++] = count; 
for(i = 0; i < count; i++) /# 逐 个 复制 这 些 数据 #/ 
{ 
outbuf[encSize++] = *src+t+;; 
STCLeft -= count; 
j 
} 


return encSize; 


} 
Rle_Encode() 函 数 是 RLE 算法 的 实现 ， 它 通过 调用 IsRepetitionStart() 水 数 判 断 从 src 开 10 
始 的 数据 是 否 是 连续 重复 数据 ， 如 果 是 连续 重复 数据 ， 则 调用 GetRepetitionCount() 函 数 计算 
出 连续 重复 数据 的 长 度 , 将 长 度 属 性 字 节 的 最 高 位 置 1 并 向 输出 缓冲 区 写 人 一 个 字 节 的 重复 数 
据 。 如 果 不 是 连续 重复 数据 , 则 调用 GetNonRepetitionCount() 函 数 计算 连续 非 重 复数 据 的 长 度 ， 
将 长 度 属性 字 节 的 最 高 位 置 0 并 向 输出 缓冲 区 复制 连续 的 多 个 非 重 复数 据 。GetRepetitionCount() 
函数 和 GetNonRepetitionCount() 函 数 都 比较 简单 ， 此 处 就 不 列 出 代码 了 ， 你 可 以 在 本 章 的 随 书 
代码 中 找到 它们 。 根 据 算法 要 求 ， 只 有 数据 重复 出 现 两 次 以 上 才 算 作 连 续 重 复数 据 ， 因 此 
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IsRepetitionStart() 函数 检查 连续 的 3 字 节 是 否 是 相同 的 数据 ， 如 果 是 则 判定 为 出 现 连续 重复 


数据 。 之 所 以 要 求 至 少 要 3 


字 节 的 重复 数据 才 判 定 为 连续 重复 数据 ,是 为 了 尽量 优化 对 短 重复 


数据 间隔 出 现时 的 压缩 效率 。 举 个 例子 , 对 于 这 样 的 数据 “AABCCD”, 如 果 不 采用 这 个 策略 ， 
最 终 的 压缩 数据 应 该 是 [0x82][A][0x01][B][0x82][C][0x01][D]， 压 缩 后 数据 长 度 是 8 字 节 。 如 
果 采 用 这 个 策略 ， 则 上 述 数据 就 被 认定 为 连续 非 重 复数 据 局 ， 最 终 被 压缩 为 [0x06] 
[A][A][B][C][C][D]， 压 缩 后 数据 长 度 是 7 字 节 ， 这 样 的 数据 越 长 ， 效 果 越 明显 。 

解压 缩 算法 相对 比较 简单 ， 因 为 两 种 情况 下 的 压缩 数据 首部 都 是 1 字 节 的 长 度 属性 标识 ,只 


要 根据 这 个 标识 判断 如 何 处 理 就 可 以 了 。 首先 从 压缩 数据 中 取出 1 字 节 的 长 度 
断 是 连续 重复 数据 的 标识 还 是 连续 非 重复 数据 的 标识 , 如 果 是 连续 重复 数据 , 则 将 标识 字 节 后 面 
的 数据 重复 复制 4 份 写 入 输出 缓冲 区 ; 如 果 是 连续 非 重 复数 据 ， 则 将 标识 字 广 后面 的 个 数据 复 
制 到 输出 缓冲 区 。n 的 值 是 标识 字 节 与 0x7F 做 与 操作 后 得 到 , 因为 标识 字 节 低 7 位 就 是 数据 长 度 


下 


属性 标识 ,然后 判 


下 


int Rle Decode(unsigned char *inbuf, int inSize, unsigned char *outbuf, int onuBufSize) 


{ 


unsigned char *src = inbuf; 
int i; 

int decSize = 0; 

int count = 0; 


while(src < (inbuf + inSize)) 


{ 


} 


unsigned char sign = *src+t+; 
int count = sign & Ox7F; 


if((decSize + count) > onuBufSize) /* 输 出 缓冲 区 空间 不 够 了 */ 


{ 


} 
if((sign & 0x80) == 0x80) /* 连 续 重复 数据 标志 */ 
{ 


return -1; 


for(i = 0; i «< count; i++) 


outbuf[decSize++] = *src; 


} 
SIC++; 
} 
else 
{ 
for(i = 0; i «< count; i++) 
outbuf[decSize++] = *src++; 
} 
} 


return decSize; 
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Rle_Decode() 函 数 是 解压 缩 算 法 的 实现 代码 ， 每 组 数据 的 第 一 字 节 是 长 度 标识 字 节 ， 其 最 高 
是 标识 位 ， 低 7 位 是 数据 长 度 属性 ， 根 据 标识 位 分 别 进 行 处 理 即 可 。 


10.2 RLE 与 PCX 图 像 文 件 格式 


PCX 图 像 文 件 格式 是 Zsoft 公司 在 20 世纪 80 年 代 初期 设计 的 一 种 图 像 文件 格式 ， 专 用 于 存 
储 该 公司 开发 的 PC Paintbrush 绘图 软件 所 生成 的 图 像 画 面 数 据 。 在 计算 机 普遍 只 能 处 理 单 色 图 
像 的 年 代 , PCX 图 像 文件 格式 就 超前 地 引入 了 彩色 图 像 的 概念 , 使 得 PCX 文件 一 度 成 为 DOS 时 
代 PC 机 上 最 流行 的 图 像 标 准 之 一 。PCX 图 像 文件 格式 不 仅 支 持 单 色 图 像 文件 ， 还 支持 16 色 和 
256 色 的 彩色 图 像 文件 。PCX 文件 采用 RLE 算法 ， 对 存储 绘图 类 型 的 图 像 (大 块 连续 色调 的 图 
像 ) 具有 比较 高 的 压缩 效率 ， 但 是 对 于 照片 和 视频 图 像 效 果 不 佳 。 


其 中 256 色 图 像 文件 的 格式 非常 简单 ， 我 们 就 以 256 色 PCX 文件 为 例 ， 介 绍 一 下 RLE 算法 
在 PCX 文件 中 的 应 用 。 


[ea 


10.2.1 PCX 图 像 文件 格式 


PCX 文件 可 以 分 成 三 类 : 单 色 PCX 文 件 ( 黑白 图 像 )、 少 于 16 种 颜色 的 彩色 PCX 文件 、256 
种 颜色 的 PCX 文件 。 最 初 的 PCX 图 像 文件 格式 被 设计 为 一 种 与 特定 图 形 显 示 硬 件 密切 相关 的 网 
像 处 理 格式 , 比如 少 于 16 种 颜色 的 PCX 文件 , 其 数据 被 分 成 4 个 颜色 层 存 放 , 这 与 EGA 和 VGA 
处 理 16 色 的 方式 密切 相关 (4 个 颜色 位 平面 )，256 色 的 PCX 文 件 与 SVGA 处 理 彩 色 图 像 的 方式 
有 关 。PCX 文件 图 像 结 构 如 图 10-1 所 示 。 


4 


manufacturer ”1 字 市 


Version 1 字 节 
PCX 图 像 文件 格式 encoding 1 字 节 
bits_per_pixel 1 字 节 
文件 头 Su 2 中 
ymin 2 字 节 
下 像 数据 xmax 2 字 节 
ymax 2 字 节 
256 色 调 色 板 ee 2 字 洛 
vres 2 字 节 

palette 48 字 节 
reserved 1 字 节 


colour_planes 1 字 节 


tt 


bytes_per line 2 字 节 


palette_type “2 字 贡 
filter 58 字 节 


图 10-1 PCX 文件 结构 示意 图 
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PCX 文件 结构 分 三 个 域 ,分别 是 文件 头 、 图 像 数据 和 最 后 附加 的 256 色调 色 板 数据 。 文 件 头 
是 一 个 大 小 和 格式 都 固定 的 表 头 ,， 长度 是 128 字 节 ， 主 要 存放 定义 图 像 的 尺寸 ,彩色 调 色 板 及 其 
也 有 关 的 图 像 数据 。 文 件 头 中 的 manufacture 字 节 是 固定 值 0x0a, 这 是 识别 PCX 文件 的 唯一 标志 。 
version 字 节 说 明 PCX 文件 的 版 本 ， 其 中 $ 对 应 的 版 本 开始 支持 256 色 图 像 。encoding 字 节 表示 
图 像 数据 压缩 编码 方式 ， 其 值 为 1 时 表示 采用 RLE 压缩 编码 的 方法 。bits_per_ pixel 说 明 每 个 像 
素 的 位 数 ， 对 于 256 色 PCX 图 像 ， 这 个 值 要 么 不 用 ， 要 么 是 8。xmin 、ymin 、xmax 和 ymax 四 
个 值 定 义 文 件 的 图 像 尺 寸 ， xmax - xmin 的 值 是 图 像 的 实际 宽度 ，ymax - ymin 的 值 是 图 像 的 实际 
高 度 ， 单 位 是 “像素 ”， 大 多 数 情况 下 ，xmin 和 ymin 的 值 都 是 0。hres 和 vres 是 图 像 的 水 平和 垂 
直 分 辨 率 。palette 是 长 度 为 48 字 节 的 彩色 调 色 板 ， 它 只 用 于 16 色 以 下 图 像 使 用 。byte_per line 
代表 图 像 解码 后 每 一 行 图 像 数 据 所 需 的 字 节 数 ， 图 像 解码 软件 可 直接 只 用 这 个 值 分 配 解码 缓冲 
区 ， 省 去 重新 计算 的 麻烦 。 

PCX 文件 的 第 二 部 分 是 采用 PCX _RLE 算法 压缩 的 图 像 数据 ,这 也 是 RLE 算法 的 一 个 变种 ， 
下 一 节 会 介绍 这 种 算法 的 原理 。PCX 文件 的 最 后 一 部 分 是 256 色 图 像 才 有 的 256 色调 色 板 数据 ， 
由 1 字 节 的 颜色 数 和 768 字 节 的 调 色 板 数据 组 成 。 之 所 以 要 附加 这 一 部 分 数据 ， 是 因为 在 定义 
PCX 文件 头 时 , 没有 考虑 到 以 后 的 图 像 会 有 这 么 多 颜色 , 因此 只 预 留 了 48 字 节 的 调 色 板 数据 区 ， 
这 显然 无 法 存放 超过 16 种 颜色 的 调 色 板 数据 , 因此 只 好 在 PCX 文件 的 尾部 附加 了 这 样 一 块 数据 
区 。 并 不 是 所 有 了 PCX 文件 都 有 256 色调 色 板 , 对 于 256 色调 色 板 数据 , 要 结合 文件 头 部 的 version 
属性 和 bits_per_pixel 属性 使 用 。 


10.2.2 PCX_RLE 算法 


10.1 节 介 绍 过 ， 对 RLE 算法 的 优化 主要 集中 在 对 连续 非 重 复数 据 的 处 理 方 式 上 ， 各 种 优化 
方法 的 差别 则 体现 在 如 何 区 分 连续 重复 数据 和 连续 非 重复 数据 上 。PCX_RLE 算法 根据 长 度 属性 
字 节 的 最 高 位 和 次 高 位 来 标识 这 个 标志 , 对 于 连续 非 重 复数 据 则 不 使 用 任何 标识 字 节 。 也 就 是 说 ， 
如 果 一 个 数据 的 最 高 两 个 比特 都 是 1， 则 说 明 这 是 一 个 长 度 属性 字 节 ， 其 低 6 位 表示 重复 数据 的 
长 度 ， 如 果 最 高 位 两 位 不 是 1， 则 表示 这 个 字 节 本 身 就 是 非 重复 数据 。 这 样 一 来 就 引入 了 一 个 问 
题 ， 如 果 非 重复 数据 本 身 刚 好 最 高 两 位 是 1， 就 会 与 连续 重复 数据 的 标志 产生 冲突 。PCX_RLE 
算法 解决 这 个 问题 的 方法 是 将 这 样 的 数据 当 作 长 度 为 1 的 连续 重复 数据 处 理 , 也 就 是 在 数据 前 插 
入 一 个 0xC1 标识 。 


int PcxRle Encode(unsigned char *inbuf, int inSize, unsigned char *outbuf, int onuBufSize) 


unsigned char *src = inbuf; 
TE 
int encSize = 0; 


while(src < (inbuf + inSize)) 


unsigned char Value = *src++; 
Te 


while((*src == value) 8& (i < 63)) 
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{ 
SIrC++; 
++; 

} 

if(i > 1) 
outbuf[encSize++] = i | OxCo; 
outbuf[encSize++] = value; 

} 

else 

| 
/* 如 果 非 重复 数据 最 高 两 位 是 ， 插 入 标识 字 节 */ 
if((value & OxCO) == OxCO) 


outbuf[encSize++] = OxC1; 


outbuf[encSize++] = value; 
} 
} 


return encSize; 


} 


PcxRle_Encode() 函 数 是 PCX_RLE 算法 的 编码 函数 ， 对 于 颜色 比较 简单 的 绘图 文件 ， 颜 色 数 
一 般 不 多 , 加 上 对 调 色 板 的 优化 ,可 以 使 大 部 分 数据 避 开 最 高 两 个 比特 是 1 的 情况 , 应 用 这 个 算 
法 的 PCX 文件 还 是 具有 很 好 的 压缩 效果 的 。PCX_RLE 算法 的 解码 函数 非常 简单 ,在 下 一 节 处 理 
PCX 文件 数据 的 代码 中 ， 可 以 看 到 解码 算法 的 体现 。 


10.2.3 ”256 色 PCX 文件 的 解码 和 显示 


256 色 PCX 文件 的 图 像 数 据 并 不 是 对 应 点 的 颜色 , 而 是 对 应 点 的 颜色 在 调 色 板 中 的 索引 , 需 


要 根据 这 个 索引 从 调 色 板 中 查 到 真正 的 颜色 才能 : 


示 图 像 。 由 于 不 需要 处 理 与 显示 设备 相关 的 颜 


色 位 平面 问题 , 256 色 PCX 文件 的 解码 和 显示 算法 非常 简单 。 首先 从 文件 开始 位 置 读 取 128 字 市 
的 文件 头 结 构 ， 判 断 是 否 是 256 色 PCX 文件 ， 然 后 从 文件 尾部 向 前 偏 移 769 字 节 ， 读 取 颜 色 数 
和 调 色 板 数据 ， 最 后 定位 到 图 像 数 据 部 分 ， 逐 行 解码 并 显示 图 像 数 据 。 假 设 已 经 有 bool 
GetPcxfileHeader(FILE *fp, PCX HEAD *header) 节 数 负 责 读 取 并 检查 PCX 文件 头 ，void 
DrawPixel(int x，int y，int colorIdx) 函 数 负责 根据 颜色 索引 和 调 色 板 数据 在 显示 设备 的 [cy] 位 
置 画 一 个 点 ， 则 处 理 显 示 PCX 文件 的 算法 框架 如 下 : 


unsigned char *bitsLine = new unsigned char[header.bytes per line]; 


int height = header.ymax - header.ymin; 
int width = header.xmax - header.xmin; 
int srcIdx = 0; 

for(int y = 0; y < height; y++) 


srcIdx += DecodePpcxLine(&header, imgData + srcIdx, bitsLine); 
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for(int x = 0; x < width; x++) 


{ 
} 
DecodePcxLine() 函 数 就 是 PCX_RLE 算法 的 核心 ，imgDatatsrcIdx 是 压缩 数据 ,解压 缩 后 的 数 
据 存 放 在 bitsLine 指向 的 缓冲 区 中 。 由 header 参数 中 的 bytes_per_line 属性 控制 ， 每 次 解压 缩 
一 行 图 像 数 据 。 
int DecodePcxLine(PCX_HEAD *header, unsigned char *imgData, unsigned char *]ineBuf) 


{ 
int i = 0; 
int offset = 0; 
while(i < header->bytes per line) 


DrawPixel(x, y, bitsLine[x]); 


unsigned char value = imgData[offset++]; 
if((value & 0xC0) == 0xCO) /* 判 断 标 志 */ 
{ 

value = value & Ox3F; /*count*/ 

for(int repeat = 0; repeat < value; repeat++) 


{ 
lineBuf[i++] = imgData[offset]; 


offset++; 
} 


else 


lineBuf[i++] = value; 


return offset; 
} 
看 到 了 吧 ，PCX 文件 的 解码 显示 就 是 这 么 简单 ，DOS 时 代 的 很 多 软件 都 使 用 PCX 文件 作为 
UI 界面 的 点 级 ,我 的 第 一 个 DOS 图 形 界面 软件 用 一 张 荷 花 的 照片 作为 Splash 窗口 ,用 的 就 是 PCX 
文件 ， 没 有 别 的 原因 ， 就 是 简单 。 


10.3 ”总 结 


本 章 介 绍 了 一 种 简单 的 数据 压缩 算法 ， 看 似 简 陋 的 算法 ， 在 很 多 情况 下 却 有 非常 好 的 效果 。 
曾经 流行 一 时 的 PCX 文件 采用 RLE 算 法 作为 数据 压缩 算法 , 说明 RLE 算 法 在 颜色 相对 单调 的 图 
像 数 据 处 理 中 具有 非常 好 的 适用 性 。 BMP 是 男 一 种 在 Windows 平台 上 非常 流行 的 图 像 文 件 格式 ， 
BMP 文件 也 支持 两 种 形式 的 压缩 格式 , 分 别称 为 BI RLE8 和 BI RLE4, 这 也 是 两 种 RLE 算法 的 
变种 算法 , 在 处 理 单 色 位 图 和 背景 比较 单调 的 图 像 时 采用 这 两 种 压缩 方式 , 也 可 以 取得 很 不 错 的 


效果 。 


10.4 ”参考 资料 
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维基 百科 “PCX 文件 ”: http://zh.wikipedia.org/wiki/PCX 
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第 7 7 章 
重 潜 河内 夺 


日 历 在 我 们 的 生活 中 扮演 着 十 分 重要 的 角色 ， 上 班 、 上 学 、 约 会 都 离 不 开 日 历 。 每 当 新 的 一 
年 开始 时 , 人 们 都 要 更 换 新 的 日 历 。 你 想 知道 未 来 一 年 的 这 么 多 天 是 怎么 确定 下 来 的 吗 ? 为 什么 
2014 年 的 国庆 节 是 星期 三 而 2015 年 的 国庆 节 是 星期 四 ?为 什么 每 年 的 农历 春节 都 相差 那么 多 
天 ? 装 五 月 真 的 能 过 两 次 端午 节 吗 ? 那 就 来 研究 一 下 日 历 算法 吧 。 本 章 就 来 介绍 日 历 的 编排 规则 
与 算法 。 这 里 面 既 有 简单 的 算法 , 比如 确定 某 日 是 星期 几 的 计算 方法 , 以 及 打印 公历 年 历 的 算法 ， 
也 有 复杂 的 算法 ， 比 如 利用 天 文 算法 精确 计算 二 十 四 节气 和 日 月 合 朔 时 间 的 算法 , 这 些 是 推算 中 
国 农历 的 基础 算法 。 最 后 我 们 实现 一 个 可 以 显示 公历 和 农历 双 历 的 日 历 控 件 , 通过 这 个 日 历 控件 
的 演示 程序 介绍 将 公历 和 农历 合成 双 历 的 对 照 算法 。 


11.1 格 里 历 〈 公 历 ) 生成 算法 


从 上 小 学 开始 , 我 就 喜欢 数学 课 胜 过 喜欢 语文 课 , 我 到 现在 还 记得 最 有 意思 的 一 节 数 学 课 是 
我 们 的 数学 老师 带 着 我 们 做 日 历 。 在 知道 了 新 的 一 年 第 一 天 是 星期 几 之 后 , 我 们 就 开始 利用 简单 
的 历法 规则 推算 之 后 的 每 一 天 是 星期 几 , 每 个 月 有 几 天 ,并 最 终 画 一 张 新 年 年 历 , 很 多 同学 甚至 
根据 疼 年 规律 推算 出 了 今后 几 十 年 的 日 历 ,。 这 是 一 个 非常 有 意思 的 问题 , 其实 就 是 关于 日 历 的 生 
成 算法 。 

要 研究 日 历 算法 ， 首 先 要 知道 日 历 的 编排 规则 ， 也 就 是 历法 。 所 谓 历法 ， 就 是 推算 年 、 月 、 
日 的 时 间 长 度 和 它们 之 间 的 关系 , 指定 时 间 序 列 的 法 则 。 我 国 的 官方 历法 是 目前 全 球 各 国 通用 的 
公历 ， 也 就 是 公元 纪年 。 公 历 实际 上 是 从 1582 年 10 月 15 日 开始 实行 的 格 里 历 ( Gregorian 
Calendar )。 这 是 一 个 比较 简单 的 历法 ， 有 人 称 之 为 “规范 历 ”。 所 谓 的 “规范 ”, 言 外 之 意 其 实 就 
是 简单 。 生 成 格 里 历 的 日 历 算法 也 相对 简单 ， 需 要 特殊 处 理 的 仅仅 是 星期 的 问题 。 


11.1.1 格 里 历 的 历法 规则 
格 里 历 的 历法 规则 非常 简单 , 它 首先 将 年 份 分 成 平常 年 ( 或 平年 ,Common Year ) 和 闽 年 ( Leap 
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Year ) 两 种 。 格 里 历 的 一 年 分 为 十 二 个 月 ， 其 中 一 月 、 三 月 、 五 月 、 七 月 、 八 月 、 十 月 和 十 二 月 
是 大 月 ， 大 月 的 一 个 月 有 31 天 。 四 月 、 六 月 、 九 月 和 十 一 月 是 小 月 ,小 月 的 一 个 月 有 30 天。 二 
月 天 数 要 根据 是 否 是 头 年 来 定 ， 如 果 是 闵 年 ， 二 月 是 29 天 ， 如 果 是 平常 年 ,二 月 是 28 天 。 平 常 
年 一 年 是 365 天 ， 间 年 一 年 是 366 天 ， 判 定 一 年 是 平常 年 还 是 头 年 的 规则 如 下 : 

(1) 如 果 年 份 是 4 的 倍数 ， 且 不 是 100 的 倍数 ， 则 是 闽 年 ; 

(2) 如 果 年 份 是 400 的 倍数 ， 则 是 闪 年 ; 

(3) 不 满足 (1)、(2) 条 件 的 就 是 平常 年 。 

格 里 历 的 置 闽 规 则 简单 总 结 就 是 一 句 话 : 四 年 一 头 ， 百 年 不 辣 , 四 百年 再 头 。 为 什么 格 里 历 
会 有 这 么 奇怪 的 规则 ? 看 了 11.4.1 节 的 介绍 你 就 明白 了 ,这 里 你 只 需要 记 住 这 句 话 就 行 了 。 判断 
给 定 的 年 份 是 否 是 半年 的 算法 也 是 一 个 很 经 典 的 算法 ,结合 了 与 、 非 等 逻辑 判断 和 组 合 ， 是 面试 
常见 的 问题 之 一 。 


bool IsLeapYear(int year) 
{ 


return ((year % 4 == 0) && (year % 100 != 0)) || (year % 400 == 0); 
} 


这 就 是 格 里 历 的 历法 规则 ， 如果 不 考虑 星期 的 问题 , 这 个 历法 真是 一 点 乐趣 都 没有 。 决定 今 
天 是 星期 几 虽 然 不 是 格 里 历历 法 的 内 容 , 但 是 是 人 们 生活 必需 的 内 容 , 下 面 我 们 就 来 讨论 一 下 今 
天 到 底 是 星期 几 的 问题 。 


11.1.2 今天 星期 几 


除了 年 、 月 、 日 ， 人 们 日 常生 活 中 还 对 日 期 定义 了 另 一 个 属性 ,就 是 星期 几 。 星 期 并 不 是 格 
里 历 范畴 内 的 东西 , 但 是 人 们 已 经 习惯 用 星期 来 管理 和 规划 时 间 ， 比 如 一 个 星期 工作 五 天 , 休息 
两 天 ,等 等 。 星期 的 规则 彻底 改变 了 人 们 的 生活 习惯 ,因此 星期 已 经 成 为 历法 的 一 部 分 了 。 星 期 
的 命名 最 早起 源 于 古巴 比 伦 。 公 元 前 7~6 世纪， 巴比伦 人 就 使 用 了 星期 制 ， 一 个 星期 中 的 每 一 
天 都 有 一 个 天 神 掌管 。 这 一 制度 后 来 传 到 古 罗 马 ， 并 逐渐 演变 成 现在 的 星期 制度 。 

如 何 知 道 某 一 天 到 底 是 星期 几 ? 除了 查 日 历 之 外 , 是 否 有 办 法 推算 出 来 某 一 天 是 星期 几 呢 ? 
答案 是 肯定 的 , 星期 不 像 年 和 月 那样 有 固定 的 历法 规则 , 但 是 星期 的 计算 也 有 自己 的 规律 。 星 期 
是 固定 的 7 天 周期 ， 其 排列 顺序 固定 ， 不 受 头 年 、 平 常年 以 及 大 小 月 的 天 数 变化 影响 。 因 此 ， 只 
要 确切 地 知道 某 一 天 是 星期 几 ， 就 可 以 推算 出 其 他 日 期 是 星期 几 。 推 算 的 方法 很 简单 ， 就 是 计算 
两 个 日 期 之 间 相 差 多 少 天 ， 用 相差 的 天 数 对 7 取 余 数 ， 这 个 余数 就 是 两 个 日 期 的 星期 数 的 差 值 。 
举 个 例子 ,假设 已 经 知道 1977 年 3 月 27 日 是 星期 日 ， 如 何 得 知 1978 年 3 月 27 日 是 星期 几 ? 按 
照 前 面 的 方法 ,计算 出 1977 年 3 月 27 日 到 1978 年 3 月 27 日 之 间 相 差 365 天 ，365 除 以 7 余数 
是 1， 所 以 1978 年 3 月 27 日 就 是 星期 一 。 

上 述 方法 计算 星期 几 的 关键 是 求 出 两 个 日 期 之 间 相 隔 的 天 数 。 有 两 种 常用 的 方法 计算 两 个 日 
期 之 间 相 隔 的 天 数 ,一 种 是 利用 公历 的 月 和 年 的 规则 直接 计算 ， 另 一 种 是 利用 儒 略 日 计算 。 除 此 
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之 外 ， 还 可 以 利用 蔡 勒 (Zeller ) 公式 计算 某 一 天 是 星期 几 ， 下 面 就 分 别 介绍 一 下 这 三 种 常用 的 
方法 。 

1. 直接 根据 日 期 的 差 值 

利用 公历 规则 直接 计算 两 个 日 期 之 间 相 差 的 天 数 , 最 简单 的 方法 就 是 将 两 个 日 期 之 间 相 隔 的 
天 数 分 成 三 个 部 分 : 前 一 个 日 期 所 在 年 份 还 剩 下 的 天 数 、 两 个 日 期 之 间 相 隔 的 整数 年 所 包含 的 天 
数 以 及 后 一 个 日 期 所 在 的 年 过 去 的 天 数 。 分 别 计算 这 三 个 部 分 的 天 数 然后 求 和 得 到 两 个 日 期 最 终 
相差 的 天 数 。 如 果 两 个 日 期 是 相 邻 两 个 年 份 的 日 期 ， 则 第 二 部 分 整 年 的 天 数 就 是 0。 以 1977 年 3 
月 27 日 到 2005 年 5 月 31 日 为 例 ,1977 年 还 剩 下 的 天 数 是 279 天 ,中 间 整 数 年 是 从 1978 年 到 2005 
年 (不 包括 2005 年 )， 共 27 年 , 包括 7 个 半年 和 20 个 平常 年 ， 总 计 9862 天 ， 最 后 是 2005 年 从 
月 1 日 到 5 月 31 日 经 过 的 天 数 151 天 。 三 者 总 和 是 10292 天 。10292 除 以 7 的 余数 是 2, 已 知 
1977 年 3 月 27 日 是 星期 日 ， 因 此 2005 年 5 月 31 日 是 星期 二 。 这 个 计算 的 算法 实现 并 不 难 ， 只 
要 细心 处 理 好 疼 年 以 及 大 小 月 的 关系 ， 一 般 不 会 出 错 。 


2. 利用 儒 略 日 计算 日 期 的 差 值 


另 一 种 计算 两 个 日 期 相差 天 数 的 方法 是 利用 癸 略 日 (Julian Day，JD ) 进行 计算 。 首 先 介绍 
下 儒 略 日 ,， 儒 略 日 是 一 种 不 记 年 、 不 记 月 、 只 记 日 的 历法 , 是 由 法 国学 者 Joseph Justus Scaliger 
(1540 一 1609 ) 在 1583 年 提出 来 的 一 种 以 天 数 为 计量 单位 的 流水 日 历 。 儒 略 日 和 儒 略 历 〈Julian 
Calendar ) 没有 任何 关系 ， 命 名 为 儒 略 日 仅仅 是 因为 他 本 人 为 了 纪念 他 的 父亲 一 一 意大利 学 者 
Julius Caesar Scaliger 1484 一 1558 )- 简 单 来 讲 , 儒 略 日 就 是 指 从 公元 前 4713 年 1 月 1 日 UTC 12:00 
开始 所 经 过 的 天 数 ,JD0 就 被 指定 为 公元 前 4713 年 1 月 1 日 12:00 到 公元 前 4713 年 1 月 2 日 12:00 
之 间 的 24 小 时 ， 以 此 顺 推 ， 每 一 天 都 被 赋予 一 个 唯一 的 数字 。 例 如 从 1996 年 1 月 1 日 12:00 开 
始 的 一 天 就 是 儒 略 日 JD2450084。 使 用 儒 略 日 可 以 把 不 同 历法 的 年 表 统 一 起 来 ,很 方便 地 在 各 种 
历法 中 追溯 日 期 。 需 要 注意 的 是 ， 儒 略 日 并 不 是 只 关注 天 数 ， 它 是 一 个 浮 点 数 ， 可 以 精确 到 秒 ， 
一 秒 钟 对 应 的 儒 略 日 差 值 是 0.0000115740 个 儒 略 日 。 另 一 个 需要 注意 的 是 儒 略 日 并 不 是 从 0:00 
开始 的 , 它 是 从 中 午 12:00 开始 的 24 个 小 时 ,因此 在 计算 日 期 时 如 果 需 要 考虑 0:00 开始 的 关系 ， 
需要 增加 或 减少 0.5 个 儒 略 日 进行 修正 。 
如 果 计 算 两 个 日 期 之 间 的 天 数 ， 利 用 儒 略 日 计算 也 很 方便 ， 先 计算 出 两 个 日 期 的 儒 略 日 数 ， 
然后 直接 相 减 就 可 以 得 到 两 个 日 期 相隔 的 天 数 。 由 格 里 历 的 日 期 计算 出 儒 略 日 数 是 一 个 很 简单 的 
事情 ， 有 多 个 公式 可 以 计算 儒 略 日 ， 本 书 选 择 如 下 公式 计算 儒 略 日 : 


和 


ID-| et -365r+| 2 2 加 2 上 am 32045 (11-1) 
5 4| |100| [400 
D-| 2 365y+| 2 + dow-32083 (11-2) 


式 (11-1) 适 用 于 格 里 历 , 式 (11-2) 适 用 于 正式 启用 格 里 历 之 前 所 使 用 的 儒 略 历 。 关 于 儒 略 历 和 
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格 里 历 的 历史 ， 请 参见 11.1.4 节 的 介绍 。 上 式 中 的 y 和 m 可 用 以 下 公式 计算 : 


[| 
4 =| 一 一 一 一 
12 


y 了 =Jear+4800 一 0 


m= month+12a—3 
以 上 各 式 中 ，year、month 和 day 分 别 是 对 应 日 历 日 期 中 的 年 份 、 月 份 和 日 期 。 需 要 注意 的 
是 ， 这 个 公式 求 出 的 结果 是 某 日 正午 12:00( 标准 时 间 ) 对 应 的 儒 略 日 ， 如 果 只 求解 整数 精度 的 
颂 略 日 ， 直 接 使 用 这 个 公式 即 可 。 如 果 要 求解 精确 到 时 分 秒 的 侨 略 日 ， 需 要 对 其 做 -0.5 个 儒 略 
日 的 修正 ， 具 体 实现 请 看 以 下 计算 儒 略 日 的 算法 实现 。 


double CalculateJulianDay(int year, int month, int day, int hour, int minute, double second) 


{ 


int a = (14 - month) / 12; 
int y = year + 4800 - a; 
int m = month + 12 * a - 3; 


double jdn = day + (153 * m + 2) / 5+365 *y+y/4; 
if(IsGregorianDays(year, month, day)) 


{ 
jdn = jdn - y / 100 + y / 400 - 32045.5; 
else 
{ 
jdn -= 32083.5; 
} 


return jdn + hour / 24.0 + minute / 1440.0 + second / 86400.0; 


1977 年 3 月 27 日 12:00 的 儒 略 日 是 JD2443230.0，2005 年 5 月 31 日 12:00 的 儒 略 日 是 
JD2453522.0， 差 值 是 10292， 与 直接 利用 公历 规则 计算 的 差 值 一 致 。 实 际 上 ， 既 然 儒 略 日 是 相对 
于 公元 前 4713 年 1 月 1 日 开始 的 流水 日 历 ， 而 公元 前 4713 年 1 月 1 日 又 被 指定 为 星期 一 ， 所 以 
直接 对 儒 略 日 整数 部 分 取 余 ， 也 可 以 推算 出 这 一 天 是 星期 几 。 比 如 2005 年 5 月 31 日 12:00 的 侨 
略 日 是 JD2453522.0， 对 7 取 余 得 到 的 结果 是 1， 也 就 是 说 2005 年 5 月 31 日 与 公元 前 4713 年 1 
月 1 日 星期 数 差 1, 那 2005 年 5 月 31 日 自然 就 是 星期 二 了 。 

3. 利用 蔡 勒 公式 计算 星期 数 

上 述 计算 星期 的 方法 虽然 步 又 简单 ， 但 是 每 次 都 要 计算 两 个 日 期 的 时 间 差 ， 不 是 非常 方便 。 
如 果 能 够 有 一 个 公式 可 以 直接 根据 日 期 计算 出 对 应 的 星期 岂 不 是 更 好 ? 幸运 的 是 , 这 样 的 公式 是 
存在 的 。 此 类 公式 的 推导 原理 仍然 是 通过 两 个 日 期 的 时 间 差 来 计算 星期 , 只 是 通过 选择 一 个 特殊 
的 日 期 来 简化 公式 的 推导 。 这 个 特殊 日 期 指 的 是 某 一 年 的 12 月 31 日 这 天 刚好 是 星期 日 这 种 情况 。 
选择 这 样 的 日 子 有 两 个 好 处 , 一 是 计算 上 可 以 省 去 计算 标准 日 期 这 一 年 的 剩余 天 数 , 二 是 计算 出 
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来 的 日 期 差 余数 是 几 就 是 星期 几 , 不 需要 再 计算 星期 的 差 值 。 现 在 我 们 就 来 推导 一 个 这 样 的 求 星 
期 几 的 公式 。 
我 们 知道 公元 元 年 的 1 月 1 日 是 星期 一 ， 那么 公元 前 1 年 的 12 月 31 日 就 是 星期 日 ,用 这 一 
天 作为 标准 日 期 ， 就 可 以 只 计算 整数 年 的 时 间 和 日 期 所 在 的 年 积累 的 天 数 。 这 个 星期 公式 如 下 : 
w= (Lx366+ Nx365+D)%7 (11.3) 
公式 中 的 工 是 从 公元 元 年 到 year 年 month 月 day 日 所 在 的 年 之 间 发 生 闽 年 的 次 数 , N 是 平常 
年 的 次 数 ，D 是 year 年 内 的 积累 天 数 。 将 整 年 数 year -1=Z+N 带 人 上 式 ， 可 得 : 


w= ((year —1)x365+L+D)%7 (11-4) 
根据 半年 规律 ， 从 公元 元 年 到 ?年 之 间 的 闲 年 次 数 是 可 以 计算 出 来 的 ， 即 : 
/| Dr ee Cy 
4 100 400 
将 式 (11-5) 代 入 到 式 (11-4)， 得 到 最 终 的 计算 公式 : 
更 yx year 一 1 Jear 一 | year 一 | of _ 
w= ((year—1) 3654| | | Tt | i |+ py (11-6) 


仍然 以 2005 年 5 月 31 日 为 例 ， 利 用 公式 (11-6) 计 算 w 的 值 为 : 
w=((2005 — 1)*365+| (2005—1)/4| -|(2005—1)/100|+| (2005—1)/400 |+151) %7 
=(731460 + 501 ~- 20+5+151)%7=732097%7=2 
得 到 2005 年 5 月 31 日 是 星期 二 ， 和 前 面 的 计算 方法 得 到 的 结果 一 致 。 公 式 (11-6) 的 问题 在 于 
计算 量 大 ， 不 利于 口算 星期 结果 。 于 是 人 们 就 在 式 (11-6) 的 基础 上 继续 推导 更 简单 的 公式 。 德 
国 数学 家 克里斯蒂 安 . 蔡 勒 ( Christian Zeller 1822 一 1899 ) 在 1886 年 推导 出 了 著名 的 为 蒙 勒 


公式 : 


w+ 2e+| SD +a 1)%7 (11-7) 


最 后 计算 出 的 余数 w 是 几 ， 结果 就 是 星期 几 ， 如 果 余数 是 0， 则 为 星期 日 。 蔡 勒 公 式 中 各 符号 的 
含义 如 下 。 
c: 世纪 数 -1 的 值 ， 如 21 世纪， 则 c= 20。 


m: 月 数 ，m 的 取 值 是 大 于 等 于 3, 小 于 等 于 14。 在 蒙 勒 公式 中 ， 某 年 的 1 月 和 2 月 看 作 上 一 
年 的 13 月 和 14 月 ， 比 如 2001 年 2 月 1 日 要 当成 2000 年 的 14 月 1 日 计算 。 


y: 年 份 ， 取 公元 纪念 的 后 两 位 ， 如 1998 年, y=98，2001 年 , y= 1。 
d: 某 月 内 的 日 数 
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为 了 方便 口算 ， 人 们 通常 将 公式 中 的 | 130 +DV/15| 一 项 改 成 | 260m+D/110|。 目 前 人 们 普遍 
认为 蔡 勒 公式 是 计算 某 一 天 是 星期 几 的 最 好 的 公式 。 但 是 蔡 勒 公式 有 时 候 计 算出 的 结果 可 能 是 负 
数 ， 需要 对 结果 +7 进行 修正 。 比 如 2006 年 7 月 1 日 ,用 蔡 勒 公式 计算 出 的 结果 是 -1， 实 际 上 这 
天 是 星期 六 。 

记得 有 一 次 看 到 电视 上 介绍 一 个 牛人 , 号 称 记忆 力 惊人 ,可 以 记得 任何 一 天 是 星期 几 。 只 要 
记 住 蔡 勒 公式 ， 心 算 快 一 点 ， 你 就 也 是 牛人 了 。ZzellerWeek() 函 数 就 是 蔡 勒 公式 的 算法 实现 ， 注 
意 对 月 份 的 修正 以 及 最 后 结果 为 负数 的 修正 ， 其 他 的 内 容 就 是 将 蔡 勒 公式 翻译 成 代码 。 


int ZellerWeek(int year, int month, int day) 


{ 
int m = month; 
int d = day; 
if(month <= 2) /* 对 小 于 的 月 份 进行 修正 */ 
year--; 
m= month + 12; 
} 
int y = year % 100; 
int c = year / 100; 
int w= (y+y/4+c/4-2*c+(13* (m+1)/5)+d-1)%7; 
if(w < 0) /* 修 正 计算 结果 是 负数 的 情况 */ 
W += 7; 
return w; 
} 


化 勒 公式 和 前 面 提 到 的 式 (11-6) 都 只 适用 于 格 里 历法 。 罗 马 教皇 在 1582 年 修改 历法 , 将 10 
月 5 日 指定 为 10 月 15 日 ， 从 而 正式 废止 儒 略 历法 ， 开 始 启用 格 里 历法 。 因 此 ， 上 述 求 星期 几 的 
公式 只 适用 于 1582 年 10 月 15 日 之 后 的 日 期 ， 对 于 1582 年 10 月 4 日 之 前 的 日 期 蔡 勒 也 推导 
出 了 适用 于 儒 略 历法 的 星期 计算 公式 ， 如 式 (11-8) 所 示 ， 有 兴趣 的 读者 可 自行 完成 算法 实现 。 


wetyt|s lt Se +a 1)%7 (11-8) 


式 (11-8) 适 用 于 对 1582 年 10 月 4 日 之 前 的 日 期 计算 星期 , 1582 年 10 月 5 日 与 1582 年 10 月 
15 日 之 间 的 日 期 是 不 存在 的 ， 因 为 它们 都 是 同一 天 。 


11.1.3 ”生成 日 历 的 算法 


日 历 一 般 以 月 为 单位 组 织 , 生成 日 历 需 要 知道 每 个 月 有 多 少 天 。 格 里 历历 法 简单 ， 除 二 月 外 
每 月 天 数 固 定 ， 二 月 则 根据 是 否 是 闵 年 确定 是 28 天 还 是 29 天 ， 比 较 适合 使 用 查 表 法 实现 。 首 先 
定义 一 个 days0fMonth 表 ， 再 次 利用 数组 下 标的 技巧 ， 直 接 用 其 表示 月 份 : 
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int daysOfMonth[MONTHES YEAR] = { 31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30，31}; 
然后 轻松 给 出 算法 实现 : 


int GetDaysOfMonth(int year, int month) 


. 
if((month < 1) || (month > MONTHES YEAR)) 
return 0; 


int days = daysOfMonth[month - 1]; 
if((month == 2) 8& IsLeapYear(year)) 
{ 


} 


days++; 


return days; 


} 

确定 每 个 月 的 天 数 之 后 ,就 可 以 依次 排列 输出 这 个 月 的 所 有 日 期 。 星期 的 位 置 是 固定 的 , 每 
个 月 的 第 一 天 是 星期 几 就 从 星期 几 对 应 的 位 置 开始 排列 数字 , 遇 到 星期 六 (星期 的 位 置 是 从 星期 
日 到 星期 六 排列 ) 就 折返 下 一 行 继续 输出 。 每 个 月 第 一 天 的 星期 数 可 以 用 蔡 勒 公式 计算 , 之 后 的 
每 一 天 不 必 重 复 使 用 蔡 勒 公式 ， 用 week = (week + 1) % 7 直接 推算 就 可 以 了 。 


void PrintMonthCalendar(int year, int month) 

{ 
int days = GetDaysOfMonth(year，month); /* 确 定 这 个 月 的 天 数 */ 
int firstDayWeek = ZellerWeek(year, month, 1); 
InsertRowSpace(firstDayWeek); 
int week = firstDayWeek; 
i i ee 
while(i <= days) 
{ 


printf("%-10d", i); 
if(week == 6) /* 到 一 周 结束 ， 切 换 到 下 一 行 输出 */ 
{ 


} 
i++; 
week = (week + 1) % 7; 


printf("\n"); 


} 
} 


printMonthCalendar() 函数 打印 指定 年 和 月 的 月 历 ， 如 上 所 述 ， 都 是 非常 简单 的 算法 。 
InsertRowSpace() 限 数 负责 根据 每 个 月 第 一 天 的 星期 数 插入 合适 的 空格 位 置 ， 使 每 个 月 的 第 一 天 
与 实际 的 星期 位 置 能 对 上 。 对 每 个 月 依次 调用 PrintMonthCalendar() 消 数 即 可 打印 出 一 年 的 日 历 。 
想 想 那 一 节 数 学 课 做 的 事情 ， 当 初 要 是 有 这 个 算法 就 省 事 多 了 。 


11.1.4 “日 历 变更 那 点 事 儿 
中 国 古 代 历 朝 历代 都 要 修订 历法 ,历法 那 就 是 王 法 , 谁 当 王 谁 说 了 算 ， 直 到 汉 唐 以 后 , 才 形 


11.1 格 里 历 (公历 ) 生成 算法 号 133 


成 了 比较 稳定 的 农历 历法 。 西 方 人 也 经 常 干 这 种 事情 ， 最 近 的 一 次 变更 就 是 在 1582 年 启用 格 里 
历 。 格 里 历 是 罗马 教皇 格 里 十 三 世 颁 布 实施 的 , 但 是 整个 欧洲 教会 也 不 是 铁 板 一 块 , 各 国 皇 室 都 
不 甩 教 皇 那 一 套 。 德 国 和 荷兰 直到 1698 年 才 使 用 格 里 历 ， 距 离 格 里 历 的 颁布 已 经 过 去 一 百 多 年 
了 ; 而 英国 则 在 1752 年 才 由 议会 批准 使 用 格 里 历 ; 至 于 沙皇 俄国 ,直到 1918 年 革命 才 开始 使 用 
格 里 历 ， 比 中 国 还 晚 。 研 究 这 个 时 期 欧洲 各 国 的 历史 是 一 件 十 分 头疼 的 事情 ,同一 个 事件 在 不 同 
国家 的 文献 记载 中 发 生 的 时 间 也 不 相同 ， 研 究 者 必需 时 时 留意 各 国 历法 变更 的 情况 。 

本 闻 我 们 讨论 一 下 从 儒 略 历 到 格 里 历 变更 的 事情 , 同时 解释 一 下 格 里 历 为 什么 会 有 这 么 奇怪 
的 置 头 规则。 


1. 儒 略 历 和 格 里 历 


在 公元 1582 年 10 月 15 日 之 前 ， 人 们 使 用 的 历法 是 源 自 古 罗 马 的 儒 略 历 。 儒 略 历 的 置 头 规 
则 非常 简单 ， 就 是 四 年 一 闽 。 这 种 置 闽 规 则 使 得 历法 时 间 每 年 比 天 文 时 间 多 出 来 0.0078 天 ， 这 
样 从 公元 前 46 年 到 公元 1582 年 一 共 累 计 多 出 了 10 天 。 再 这 样 下 去 历法 和 天 气 时 节 就 要 脱节 了 ， 
为 此 ， 当 时 的 教皇 格 里 十 三 世 将 1582 年 10 月 5 日 人 为 指定 为 10 月 15 日 ， 并 开始 启用 新 的 置 闽 
规则 ， 这 就 是 后 来 沿用 至 今 的 格 里 历 。 

2. 1752 年 9 月 到 底 是 怎么 回 事 儿 

如 果 你 用 的 操作 系统 是 Unix 或 Linux， 在 控制 台 输入 以 下 命令 : 

#cal 9 1752 
你 会 看 到 这 样 一 个 奇怪 的 月 历 输出 : 


September 1752 

Su Mo Tu We Th Fr Sa 
1 2 14 15 16 

17 18 19 20 21 22 23 

24 25 26 27 28 29 30 


1752 年 的 9 月 缺 了 11 天， 到 底 怎 么 回 事 儿 ? 这 其 实 还 是 因为 从 儒 略 历 到 格 里 历 的 转换 造成 
。1582 年 10 月 $ 日 ， 罗 马 教皇 格 里 十 三 世 宣布 启 用 更 为 精确 的 格 里 历 ， 但 是 整个 欧洲 大 陆 并 
是 所 有 国家 都 立即 采用 格 里 历 ， 比 如 英国 就 是 直到 1752 年 9 月 议会 才 批准 采用 格 里 历 ， 所 以 
国 及 其 所 有 殖民 地 的 历法 一 直到 1752 年 9 月 才 发 生 跳 变 ,“ 跟 上 ”了 格 里 历 。Linux 的 cal 指 
起 源 于 最 初 AT&T 的 Unix， 当 然 采 用 的 是 美国 历法 ， 但 是 美国 历史 太 短 ， 再 往 前 就 只 能 采用 
国 历法 ， 所 以 cal 指令 的 结果 就 成 了 这 样 。 对 于 采用 格 里 历 的 国家 来 说 ， 只 要 知道 1582 年 10 
月 发 生 了 日 期 跳 变 就 行 了 ， 可 以 不 用 关心 1752 年 9 月 到 底 是 怎么 回 事 儿 。 但 是 对 于 研究 历史 和 
考古 的 人 来 说 ， 就 必需 要 了 解 这 段 历史 , 搞 清楚 每 个 欧洲 国家 改 用 格 里 历 的 年 份 ， 否则 就 可 能 在 
一 些 问题 上 出 错 。 在 欧洲 研究 历史 ,你 会 发 现 很 多 事件 都 是 有 多 个 时 间 版 本 的 ， 比 如 大 科学 家 和 牛 
顿 的 生日 就 有 两 个 时 间 版 本 ， 一 个 是 按照 儒 略 历历 法 的 1642 年 12 月 25 日 ， 另 一 个 是 格 里 历历 
法 的 1643 年 1 月 4 日 。 对 于 英国 人 来 说 ，1752 年 之 前 都 是 按照 侍 略 历 计算 的 ， 所 以 英国 的 史书 
可 能 会 记载 牛顿 出 生 在 圣诞 节 ， 这 也 没什么 可 奇怪 的 。 


站 少 当局 于 
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3. 公历 的 半年 

格 里 历 的 置 闽 规 则 是 “四 年 一 疼 、 百 年 不 疼 、 四 百年 再 图 ”， 为 什么 会 有 这 人 么 奇怪 的 置 韶 规 
则 呢 ? 这 实际 上 与 天 体 运行 周期 与 人 类 定义 的 历法 周期 之 间 的 误差 有 关 。 地 球 绕 太 阳 运 转 的 周期 
是 365.2422 天 ， 即 一 个 回归 年 ( tropical year )， 而 公历 的 一 年 是 365 天 ， 这 样 一 年 就 比 回归 年 少 
了 0.2422 日 ， 四 年 积累 下 来 就 少 了 0.9688 天 ( 约 1 天 )， 于 是 设置 一 个 闽 年 ， 让 这 一 年 多 一 天 。 
这 样 一 来 ， 四 个 公历 年 又 比 四 个 回归 年 多 了 0.0312 天 ， 这 样 经 过 四 百年 就 会 多 出 3.12 天 ， 也 就 
是 说 每 四 百年 要 减少 3 个 半年 才 行 ， 于 是 就 设置 了 “百年 不 辣 、 四 百年 再 六 ”的 置 头 规 则 。 

实际 上 公历 的 置 头 还 有 一 条 规则 ， 就 是 对 于 数值 很 大 的 年 份 ， 如 果 能 整除 3200， 还 必须 同 
时 能 整除 86400 才 是 头 年 。 这 是 因为 前 面 即 使 四 百年 一 关 ， 仍 然 多 了 0.12 天 ,平均 就 是 每 年 多 
0.0003 天 ,于 是 每 3200 年 就 又 多 出 0.96 天 , 于 是 能 被 3200 整除 的 年 就 不 是 国 年 了 。 然 而 误差 并 
没有 终结 ， 每 3200 年 减少 一 个 装 年 〈 减 少 一 天 ) 实际 上 多 减 了 0.04 天 ， 这 个 误差 还 要 继续 累计 
计算 ， 只 要 凑 24 个 3200 年 周期 ， 发 现 又 凑 出 了 0.96 天 ， 于 是 可 以 设置 头 年 了 ， 这 就 是 每 3200 
年 不 图 ，86400 年 再 头 的 原因 。 但 是 你 注意 没有 ， 这 个 误差 还 是 存在 ， 还 需要 继续 凑 。 我 已 经 骨 
演 了 , 读者 有 兴趣 自己 算 吧 。 最 后 的 置 疼 规 则 是 这 样 的 : 能 被 4 整除 上 且 不 能 被 100 整除 ; 或 者 能 
被 400 整除 且 不 能 被 3200 整除 ; 或 者 能 被 86400 整除 的 年 份 是 闲 年 。 

是 谁 说 公历 是 精确 的 历法 ”看 到 这 个 置 状 规则 后 就 不 会 有 人 再 这 么 说 了 吧 ? 只 要 人 们 采用 
“天 ”作为 历法 单位 ， 就 不 会 有 精确 的 历法 。 天 体 的 运行 规律 怎么 可 能 刚好 合乎 人 类 要 求 ? 假如 
有 一 天 ， 人 类 给 地 球 加 装 一 个 推进 装置 ， 能 精确 控制 地 球 公转 的 周期 刚好 是 365 天 ,这样 人 类 就 
有 精确 的 历法 了 。 要 不 ,不 要 用 天 计时 了 ， 全 都 用 秒 ， 比 如 “五 千 亿 四 千 八 百 万 三 千 三 百 二 十 一 
宇宙 秒 时 , 我 在 电影 院 门 口 等 你 , 不见 不 散 "。 你 想 过 这 样 的 生活 吗 ” 还 是 老 老实 实用 格 里 历 吧 。 


11.2 ”二 十 四 节气 的 天 文学 计算 


中 国 古 代 历 法 都 是 以 月 亮 运 行规 律 为 主 , 严格 按照 朔望月 长 度 定义 月 , 但 是 由 于 朔望月 长 度 
和 地 球 回归 年 长 度 无 法 协调 , 会 导致 农历 季节 和 天 气 的 实际 冷暖 无 法 对 应 ,因此 聪明 的 古人 将 月 
亮 运 行规 律 和 太阳 运行 规律 相 结合 制定 了 中 国 农历 的 历法 规则 ,在 这 种 特殊 的 阴阳 结合 的 历法 规 
则 中 , 三 十 四 节气 就 扮演 着 非常 重要 的 作用 , 它 是 联系 月 亮 运 行规 律 和 太阳 运行 规律 的 纽带 。 正 
是 由 于 二 十 四 节气 结合 置 头 规 则 , 使 得 农历 的 春 夏秋 冬 四 季 和 地 球 绕 太 阳 运 动 引 起 的 天 气 冷 暧 变 
化 相 一 致 ， 成 为 中 国 几 千年 来 生产 和 生活 的 依据 。 

二 十 四 节气 在 中 国 古 代 历 法 中 扮演 着 非常 重要 的 角色 ， 本 节 将 介绍 二 十 四 节气 的 基本 知识 ， 
以 及 如 何 使 用 VSOP82/87 行星 运行 理论 计算 二 十 四 节气 发 生 的 准确 时 间 。 


11.2.1 二 十 四 节气 的 起 源 


二 十 四 节气 起 源 于 中 国 黄河 流域 。 远 在 春秋 时 代 ， 古人 就 开始 使 用 仲春 、 仲 夏 、 仲 秋 和 仲 冬 
四 个 节气 指导 农耕 种 植 。 后 来 经 过 不 断 地 改进 与 完善 ， 到 秦汉 年 间 ， 二 十 四 节气 已 经 基本 确立 。 
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公元 前 104 年 ( 汉 武 帝 太初 元 年 ), 汉 武 帝 颁 布 由 邓 平等 人 制定 的 《太初 历 》， 正 式 把 二 十 四 节气 
订 于 历法 ,明确 了 二 十 四 节气 的 天 文 位 置 。 二 十 四 节气 天 文 位 置 的 定义 ， 就 是 从 太阳 黄 经 零度 开 
始 ， 沿 黄 经 每 运行 15 度 所 经 历 的 时 日 称 为 一 个 节气 。 太 阳 一 个 回归 年 运行 360 度 ， 共 经 历 二 十 
四 个 节气 ,每 个 公历 月 对 应 两 个 节气 。 其 中 ,每 月 第 一 个 节气 为 “节令 ”， 即 立春 、 惊 执 、 清 明 、 
立夏 、 芒 种 、 小 暑 、 立 秋 、 白露 、 寒露 、 立冬、 大 雪 和 小 寒 十 二 个 节令 ; 每 月 的 第 二 个 节气 为 “中 
气 "， 即 雨水 、 春 分 、 谷 雨 、 小 满 、 夏 至 、 大 暑 、 处 暑 、 秋 分 、 霜 降 、 小 雪 、 冬 至 和 大 寒 十 二 个 
中 气 。“ 节 令 ” 和 “中 气 ” 交 替 出 现 ， 各 历时 15 天 ， 人 们 习惯 上 把 “节令 ”和 “中 气 ” 统 称 为 


Se 
Vo 


11.2.2 ”二 十 四 节气 的 天 文学 定义 


为 了 更 好 地 理解 二 十 四 节气 的 天 文 位 置 ， 首 先 要 解释 儿 个 天 文学 概念 。“ 天 球 ” 是 人 们 为 了 
研究 天 体 的 位 置 和 运动 规律 而 引入 的 一 个 假象 的 球体 ， 根 据 观察 点 ( 也 就 是 球 心 ) 的 位 置 不 同 ， 
可 分 为 “日 心 天 球 ”、“ 地 心 天 球 ” 等 。 图 11-1 就 是 天 球 概念 的 一 个 简单 示意 图 。 


天 球 南极 
图 11-1 天 球 概念 示意 图 


天 文学 中 常用 的 一 个 坐标 体系 就 是 “地 心 天 球 ”， 它 与 地 球 同心 且 有 相同 的 自转 轴 ， 理 论 上 
具有 无 限 大 的 半径 。 地 球 的 赤道 和 南北 极点 延伸 到 天 球 上 ,对 应 着 天 赤道 和 南北 天 极点 。 和 地 球 
上 用 经 纬度 定位 位 置 一 样 ， 天 球 也 划分 了 经 纬度 ， 分 别 命名 为 “ 赤 经 ”和 “ 赤 纬 "， 地 球 上 的 经 
度 以 度 (分 秒 ) 为 单位 ， 赤 经 以 时 (分 秒 ) 为 单位 。 天 空中 的 所 有 天 体 都 可 以 投射 到 天 球 上 , 用 
赤 经 和 赤 纬 定位 天 体 在 天 球 上 的 位 置 。 地 球 沿 着 一 个 近似 椭圆 的 轨道 绕 大 阳 公 转 ,这 个 公转 轨道 
所 在 的 平面 就 是 “黄道 面 "。“ 黄 道 ”( ecliptic ) 是 地 球 绕 太阳 公转 轨道 所 在 的 “黄道 面 ” 向 外 延 


136 b> 第 11 章 算法 与 历法 


伸 与 天 球 (地 心 天 球 ) 相交 的 大 圆 ， 由 于 地 球 公转 受 月 球 和 其 他 行星 的 摄 动 ， 地球 的 公转 轨道 并 
不 是 严格 的 平面 , 因此 黄道 的 严格 定义 是 : 地 月 系 质心 绕 太 阳 公 转 的 瞬时 平均 轨道 平面 与 天 球 相 
交 的 大 圆 。 黄 道 和 天 赤道 所 在 的 两 个 平面 并 不 是 重 全 的， 它们 之 间 存 在 一 个 23 度 26 分 的 交角 ， 
称 为 “ 黄 赤 交角 ”。 由 于 黄 赤 交角 的 存在 ， 黄 道 和 天 赤道 就 在 天 球 上 有 两 个 交点 ， 这 两 个 交点 就 
是 春分 点 和 秋分 点 。 在 天 球 上 以 黄道 为 基 圈 可 以 形成 黄道 坐标 系 , 在 黄道 坐标 系 中 , 也 使 用 了 经 
纬度 的 概念 ， 分 别称 为 “ 黄 经 ”和 “ 黄 纬 "。 天 体 的 黄 经 从 春分 点 起 沿 黄道 向 东 计 量 ， 春 分 点 是 
黄 经 0 度 ， 沿 黄道 一 周 是 360 度 ， 使 用 的 单位 是 度 、 分 和 秒 。 黄 纬 以 黄道 测量 平面 为 准 ， 向 北 记 
为 0 度 到 90 度 ， 向 南 记 为 0 度 到 -90 度 。 
黄道 平面 可 以 近似 地 理解 为 地 球 绕 太 阳 公 转 的 平面 ， 以 黄道 为 基 圈 的 黄道 坐标 系 根据 观测 
中 心 是 太阳 还 是 地 球 还 可 以 区 分 为 日 心 坐标 系 和 地 心 坐 标 系 ， 对 应 天 体 的 黄道 坐标 分 别 被 称 为 
“日 心 黄 经 、 日 心 黄 纬 ”和 “地 心 黄 经 、 地 心 黄 纬 ”。 日 心 黄 经 和 日 心 黄 纬 比较 容易 理解 ， 因 为 
太阳 系 的 行星 都 是 绕 太 阳 公转 的 ， 以 太阳 为 中 心 将 这 些 行星 向 天 球 上 投影 是 最 简单 的 确定 行星 
位 置 关系 的 做 法 。 但 是 人 类 自古 观察 太阳 的 周年 运动 ， 都 是 以 地 球 为 参照 ， 以 太阳 的 周年 视 运 
动 位 置 来 计算 太阳 的 运行 轨迹 ， 使 用 的 其 实 都 是 地 心 黄 经 和 地 心 黄 纬 。 要 了 解 古 代 历法 ， 理 解 
这 一 点 非常 重要 。 图 11-2 就 解释 了 造成 这 种 视觉 错觉 的 原因 。 古 人 由 于 观测 条 件 限制 ， 只 能 
据 视 觉 感觉 认为 是 太阳 沿 着 黄道 绕 地 球 运 转 ， 因 此 设 定 太阳 从 黄 经 ( 黄道 经 度 ) 零度 起 ( 以 春 
分 点 为 起 点 自 西向 东 度 量 )， 将 太阳 沿 黄 经 每 运行 15 度 所 经 历 的 时 日 称 为 一 个 节气 。 太 阳 每 年 
运行 360 度 ， 共 经 历 二 十 四 个 节气 ， 春 季 的 节气 有 立春 (315 度 )、 雨 水 (330 度 )、 惊 扑 ( 345 
度 )、 春 分 (0 度 、360 度 )、 清 明 (15 度 ) 和 谷雨 (30 度 )， 夏 季 的 节气 有 立夏 (45 度 )、 小 满 
(60 度 )、 芒种 (75 度 )、 夏 至 (90 度 )、 小暑 (105 度 ) 和 大 暑 (120 度 ), 秋季 的 节气 有 立秋 ( 135 
度 )、 处 暑 (150 度 )、 白 露 (165 度 )、 秋 分 (180 度 )、 寒 露 ( 195 度 ) 和 霜降 ( 210 度 )。 冬 季 
的 节气 有 立冬 (225 度 )、 小 雪 ( 240 度 )、 大 雪 (255 度 )、 冬 至 (270 度 )、 小寒 (285 度 ) 和 大 
寒 (300 度 )。 二 十 四 个 节气 平分 在 公历 的 12 个 月 中 , 每 月 一 节气 一 中 气 。 二 十 四 节气 反映 了 太 
阳 的 周年 运动 (以 地 球 为 参照 物 的 视 运 动 )， 所 以 节气 在 现行 的 公历 中 日 期 基本 固定 ， 上 半年 在 
6 日 、21 日 ,下 半年 在 8 日 、23 日 ， 前 后 不 差 1~ 2 天。 中 国民 间 流 传 的 《二 十 四 节气 歌 》 就 是 
为 了 方便 记忆 这 些 节气 。 

春雨 惊 春 清 谷 天 ， 

夏 满 艺 夏 嗜 相 连 ， 

秋 处 露 秋 寒 霜降 ， 

冬 雪 雪 冬 小 大 寒 ， 

每 月 两 节 不 变更 ， 

最 多 相差 一 两 天 。 

古人 定义 二 十 四 节气 的 位 置 , 是 太阳 沿 着 黄道 运行 时 的 视觉 位 置 , 每 个 节气 对 应 的 黄道 经 度 
其 实 是 地 心 黄 经 。 从 图 11-2 可 以 看 出 ,日 心 黄 经 和 地 心 黄 经 存在 180 度 的 转换 关系 ， 同 样 可 以 
理解 ,日 心 黄 纬 和 地 心 黄 纬 在 方向 上 是 相反 的 ， 因此 可 以 很 方便 地 将 两 类 坐标 相互 转换 ,转换 公 


pa 


式 是 : 


5 月 太 虹 


在 天 球 上 的 位 置 和 一 
二 se 


经 度数 时 的 那个 瞬间 的 时 间 。 所 谓 的 月 
普 勒 三 大 行星 定律 , 计算 出 与 历法 密切 相关 的 地 球 、 太 阳 和 


本 


图 11-2 


] 到 


太阳 地 心 黄 经 = 地 球 日 心 黄 经 + 180"? 


太阳 地 心 黄 纬 = -地 球 日 心 黄 纬 


太阳 黄道 视觉 位 置 原理 图 ( 图 片 来 自 百 度 百 科 ) 


了 解 了 以 上 天 文学 基础 之 后 , 就 可 以 着 手 对 二 十 四 节气 的 发 生 时 间 进 行 计算 了 。 我 们 常 说 的 
节气 发 生 时 间 , 其 实 就 是 在 太阳 沿 着 黄道 做 视觉 运动 的 过 程 中 ， 当 太阳 地 心 黄 经 等 于 某 个 节气 黄 
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(11-9) 
(11-10) 


天文 算法 计算 二 十 四 节气 时 间 , 就 是 根据 牛顿 力学 原理 或 
日 亮 三 个 天 体 的 运行 轨道 和 时 间 参 


数 ,以 此 得 出 当 这 些 天 体位 于 某 个 位 置 时 的 时 间 。 这 样 的 天 文 计算 需要 计算 者 有 扎实 的 微 积 分 学 、 


几何 学 和 球面 三 


ELP-2000/82 


自学 知识 ， 


11.2.3 VSOP-82/87 行星 理论 


古代 天 文学 家 在 对 包括 1 


地 球 和 


党 在 内 的 行 


运行 轨道 精确 计算 后 发 现 , 天 体 的 运行 因为 受 


令 广 大 天 文 爱好 者 望而却步 。 但 是 随 着 VSOP-82/87 行星 理论 以 及 
月 球 理论 的 出 现 ， 天 文 计 算 变 得 简单 易 行 。 


相近 天 体 的 影响 , 并 不 严格 遵循 理论 方法 计算 出 来 的 轨道 ,而 是 在 理论 轨道 附近 波动 。 这 种 影响 


在 天 文学 上 称 为 摄 动 ， 摄 动 很 难 精确 计算 ,只 能 根据 经 验 估算 。 但 是 经 过 长 


期 的 观测 和 计算 ,天 


文学 家 发 现行 星 轨道 因为 摄 动 影 响 而 产生 的 波动 其 实 也 是 有 规律 的 , 即 在 相当 长 的 时 间 内 呈现 出 


138 b> 第 11 章 算法 与 历法 


周期 变化 的 趋势 。 于 是 天 文学 家 开始 研究 这 种 周期 变化 , 希望 通过 一 种 类 似 曲 线 拟 合 的 方法 ,对 
一 些 周期 计算 项 按照 某 种 计算 式 迁 代 求 和 计算 代替 积分 计算 来 模拟 行星 运行 轨迹 。 这 种 计算 式 可 
以 描述 为 : a+&it+cz+…xcosD+9g+72+…)， 其 中 7 上 是 时 间 参 数 ， 这 样 的 理论 通常 称 为 半 解 
析 ( semi-analytic ) 理论 。 其 实 早 在 18 世纪 ， 欧 洲 学 者 Joseph Louis Lagrange 就 开始 尝试 用 这 种 
周期 项 计算 的 方法 修正 行星 轨道 ,但 是 他 采用 的 周期 项 计算 式 是 线性 方程 ， 精 度 不 高 。 

1982 年 , P Bretagnon 公开 发 表 了 VSOP 行星 理论 ", 该 理论 是 一 个 描述 太阳 系 行星 轨道 在 相 
当 长 时 间 范 围 内 周期 变化 的 半 解 析 理 论 。VSOP82 理论 是 VSOP 理论 的 第 一 个 版 本 ， 提 供 了 对 太 
阳 系 几 大 行星 位 置 计算 的 周期 序列 , 通过 对 周期 序列 进行 正弦 或 余弦 项 累加 求 和 , 就 可 以 得 到 这 
个 行星 在 给 定时 间 的 轨道 参数 。 不 过 VSOP82 由 于 每 次 都 会 计算 出 全 部 超 高 精度 的 轨道 参数 , 这 
些 轨道 参数 对 于 历法 计算 这 样 的 民用 场合 很 不 适用 。1987 年 ，Bretagnon 和 Francou 创建 
VSOP87 行星 理论 ， 该 理论 不 仅 能 计算 各 种 精密 的 轨道 参数 ， 还 可 以 直接 计算 出 行星 的 位 置 ， 行 
星 位 置 可 以 是 各 种 坐标 系 ， 包 括 黄道 坐标 系 。VSOP87 行星 理论 由 6 张 周 期 项 系数 表 组 成 ， 分 别 
是 VSOP87、VSOP87A、VSOP87B、VSOP87C、VSOP87D 和 VSOP87E， 其 中 VSOP87D 表 可 以 
直接 计算 行星 日 心 黄 经 ( 工 )、 日 心 黄 纬 (B ) 和 到 太阳 的 距离 (R )， 此 表 计 算出 的 结果 适用 于 节 
气 位 置 判 断 。 

VSOP87D 表 包 含 了 三 部 分 数据 ， 分 别 是 8 大 行星 的 日 心 黄 经 周期 项 系数 表 ( 工 表 )、 日 心 黄 
纬 周 期 项 系数 表 (了 B 表 ) 和 行星 与 太阳 距离 周期 项 系数 表 (了 表 )。 以 地 球 的 数据 为 例 , 工 表 由 
L0 ~L5 六 部 分 组 成 ， 每 一 部 分 都 包含 若干 个 周期 项 系数 条 目 ， 每 个 周期 项 系数 条 目 又 包含 若干 
个 参数 ,用 于 计算 各 种 轨道 参数 和 位 置 参数 。 计 算 地 球 的 日 心 黄 经 只 需要 用 到 其 中 三 个 系数 。 计 
算 所 有 的 周期 项 系数 并 不 是 必须 的 , 有 时 候 减 少 一 些 系数 比较 小 的 周期 项 可 以 减少 计算 所 花费 的 
时 间 ， 当 然 ， 这 会 牺牲 一 点 精度 。 假 设计 算 地 球 日 心 黄 经 的 三 个 系数 是 A、B 和 C， 则 每 个 周期 
项 的 计算 表达 式 是 : 


A*cos(B+C7) (11-11) 
式 (11-11) 中 的 z* 是 儒 略 千年 数 ，r 的 计算 公式 如 下 : 
t= (JDE - 2451545.0) / 365250 
JDE 是 计算 轨道 参数 的 时 间 ， 单 位 是 儒 略 日 ，2451545.0 是 公元 2000 年 1 月 1 日 12 时 的 儒 
略 日 数 。 
以 L0 表 的 第 二 个 周期 项 为 例 , 这 个 周期 项 数据 中 与 日 心 黄 经 计算 有 关 的 三 个 系数 分 别 是 A= 
3341656.456 ，B=4.66925680417 ，C=6283.07584999140 ， 则 第 二 个 周期 项 的 计算 方法 是 : 


3341656.456 * cos(4.66925680417 + 6283.0758499914 *z)。 对 L0 表 的 各 项 分 别 计算 后 求 和 可 得 到 
L0 表 周 期 项 总 和 L0， 对 工 表 的 其 他 几 个 部 分 使 用 相同 的 方法 计算 周期 项 和 ， 可 以 得 到 Ll1、L2、 


QD VSOP 行星 理论 ,英文 名 称 是 Secular Variations of the Planetary Orbits。VSOP 的 缩写 其 实 源 于 法 文 名 称 : Variations 


Seculaires des Orbites Planétaires。 
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L3、L4 和 L5， 然 后 用 式 (11-12) 计 算出 最 终 的 地 球 日 心 黄 经 ， 单 位 是 弧度 : 


L=(L0+L1*rL2*?+L3*T+LA*T+HLS* 7)/10° (11-12) 

式 (11-12) 需 要 多 次 计算 z+ 的 乘 方 ， 对 于 这 样 的 多 项 式 求 和 ， 可 以 利用 “ 堆 纳 法 则 ”对 其 进 
行 优化 ,转化 成 式 (11-13) 的 形式 , 虽然 形式 上 繁琐 了 一 点 , 但 是 避免 了 重复 计算 zt 的 乘 方 ， 非常 

用 同样 的 方法 对 地 球 日 心 黄 纬 的 周期 项 系数 表 和 计算 行星 和 太阳 距离 的 周期 项 系数 表 计 
算 求 和 ， 可 以 得 到 地 球 日 心 黄 纬 B 和 日 地 距离 R，B 的 单位 也 是 弧度 ，R 的 单位 则 是 天 文 单位 
( AU ) 

VSOP82/87 行星 理论 中 的 周期 项 系数 对 不 同 的 行星 具有 不 同 的 精度 ， 对 地 球 来 说 ， 在 
1900 ~ 2100 年 的 200 年 跨度 期 间 , 计算 精度 是 0.005"。 前面 曾 说 过 ,对 于 不 需要 这 么 高 精度 的 
计算 应 用 时 , 可 以 适当 减少 一 些 系数 比较 小 的 周期 项 , 减少 计算 量 , 提高 计算 速度 。Jean Meeus 
在 他 的 《天 文 算法 》 一 书 中 就 给 出 了 一 套 精 简 后 的 VSOP87D 表 的 周期 项 ， 将 计算 地 球 黄 经 的 
L0 表 由 原来 的 559 项 精简 到 64 项 ， 计 算 地 球 黄 纬 的 BO 表 其 至 被 精简 到 只 有 5 项 。 从 实际 效 
果 看 ,计算 精 度 下 降 并 不 多 ,但 是 极 大 地 减少 了 计算 量 。 

使 用 VSOP87D 周期 项 系数 表 计 算得 到 的 是 J2000.0 平 黄道 和 平 春分 点 ( mean dynamic ecliptic 
and equinox ) 为 基准 的 日 心 黄 经 和 日 心 黄 纬 ， 其 值 与 标准 FK5 系统 " 略 有 差别 。 如 果 对 精度 要 求 
很 高 ， 可 以 采用 下 面 的 方法 将 计算 得 到 的 日 心 黄 经 和 日 心 黄 纬 转 到 FK5 系统 。 

首先 计算 L', 工 的 单位 是 度 : 

L=(((((LS5 *Tt+L4)*Tt+L3)* r+L2)* r+L1)*r+L0)/10° (11-13) 
L'=L — 1.397*T — 0.00031*T? (11-14) 

式 (11-14) 中 了 是 儒 略 世纪 数 ， 它 与 儒 略 千年 数 rz 的 计算 关系 是 : T= 10 *r。 计 算出 工 之 后 ， 

就 可 以 利用 式 (11-15) 和 式 (11-16)， 分别 计算 计算 L 和 B 的 修正 值 AL 和 AB: 


AL = -0.09033 + 0.03916 * (cos(L) + sin(L)) * tan(B) (11-15) 


AB = +0.03916* (cos(L') - sin(L (11-16) 
这 里 需要 注意 一 点 ，AL 和 AB 的 单位 都 是 ", 是 度 、 分 、 秒 角度 单位 体系 ,需要 将 其 转换 成 


Q@ 天 文 单位 ( Astronomical Unit ) 是 一 个 长 度 单位 ， 约 等 于 地 球 与 太阳 的 平均 距离 。 天 文 单位 是 天 文 常数 之 一 ， 是 
天 文学 中 测量 距离 特别 是 测量 太阳 系 内 天 体 之 间 的 距离 的 基本 单位 。 地 球 到 太阳 的 平均 距离 大 约 为 一 个 天 文 单 
位 ， 约 等 于 1.496 亿 千 米 。1976 年 ， 国际 天 文学 联 会 把 一 天 文 单位 定义 为 一 颗 质量 可 忽略 、 公 转轨 道 不 受 干扰 而 
公转 周期 为 365.2568983 日 ( 即 一 高 斯 年 ) 的 粒子 与 一 个 质量 相等 约 一 个 太阳 的 物体 的 距离 。 当 前 普遍 被 接受 
并 使 用 的 天 文 单位 的 值 是 149 597 870 691 + 30 米 〈 约 一 亿 五 千 万 千 米 )。 
@ FK5 是 常用 的 目 视 星 表 系 统 ， 又 称 第 五 基本 星 表 ,是 在 FK4 ( 第 四 基本 星 表 ) 的 基础 上 发 展 出 来 的 ， 对 FK4 星 表 
进行 了 修正 ， 于 1984 年 正式 启用 。 它 定义 了 一 个 以 太阳 质心 为 中 心 ，J2000.0 平 赤道 和 春分 点 为 基准 的 天 球 平 赤 
道 坐标 系 。 近 年 来 国际 上 又 编制 了 FK6 星 表 ( 第 六 基本 星 表 ), 但 是 还 没有 正式 启用 。 
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弧度 单位 后 再 对 L 和 B 进行 修正 。 


CalcSunEclipticLongitudeEC() 消 数 就 是 使 用 VSOP87 行星 理论 计算 行星 日 心 黄 经 的 代码 实 
现 , 整个 计算 过 程 和 前 文 描述 一 样 , 首先 根据 VSOP87D 表 的 数据 计算 出 L0-L5, 然后 用 式 (11-13) 
计算 出 地 球 的 日 心 黄 经 ， 最 后 使 用 式 (11-9) 将 结果 转换 成 太阳 的 地 心 黄 经 。 代 码 如 下 : 


double CalcSunEclipticLongitudeEC(double dt) 


{ 
double LO = CalcperiodicTerm(Earth LO, COUNT OF(Earth LO), dt); 
double L1 = CalcperiodicTerm(Earth L1, COUNT OF(Earth L1), dt); 
double L2 = CalcperiodicTerm(Earth L2, COUNT OF(Earth 1L2), dt); 
double L3 = CalcperiodicTerm(Earth L3, COUNT OF(Earth L3), dt); 
double L4 = CalcperiodicTerm(Earth L4, COUNT OF(Earth L4), dt); 
double L5 = CalcperiodicTerm(Earth L5, COUNT OF(Earth L5), dt); 
double L = (((((L5 * dt + 14)* dt + 13)* dt + 12) * dt + L1) * dt + LO0O) / 100000000.0; 
/* 地 心 黄 经 = 日 心 黄 经 + 180 度 */ 
return L + PI; 
} 
CalcperiodicTerm() 函 数 使 用 式 (11-11) 对 coff 参数 指定 的 周期 项 系数 表 进 行 计 算 求 和 计算 。 采 


用 同样 的 方法 可 以 计算 出 太阳 的 地 心 黄 纬 ,CalcSunEclipticLatitudeEC() 销 数 首 先 计 算出 太阳 的 日 


心 黄 纬 ， 然 后 用 式 (11-10) 将 其 转换 为 地 心 黄 纬 。 

double CalcSunEclipticLatitudeEC(double dt) 

4 
double BO = CalcperiodicTerm(Earth BO, COUNT OF(Earth BO), dt); 
double B1 = CalcperiodicTerm(Earth Bi1, COUNT OF(Earth B1), dt); 
double B2 = CalcperiodicTerm(Earth B2, COUNT OF(Earth B2), dt); 
double B3 = CalcPeriodicTerm(Earth B3, COUNT OF(Earth B3), dt); 
double B4 = CalcperiodicTerm(Earth B4, COUNT OF(Earth B4), dt); 
double B = (((((B4 * dt) + B3) * dt + B2) * dt + B1) * dt + BO) / 100000000.0; 
/# 地 心 黄 纬 = 一 日 心 黄 纬 */ 
return -B; 

} 


计算 出 地 心 黄 经 和 地 心 黄 纬 之 后 , 就 可 以 使 用 式 (11-15) 和 式 (11-16) 的 修正 计算 将 其 转 到 FK5 
目 视 系统 ， 以 计算 黄 经 修正 量 AL 为 例 ， 其 算法 实现 如 下 : 


double AdjustSunEclipticLongitudeEC(double dt, double longitude, double latitude) 
{ 


double T = dt * 10; //T 是 儒 略 世纪 数 


longitude = RadianToDegree(longitude); 
double dbLdash = longitude - 1.397 * T - 0.00031 * T *T; 


// 转换 为 弧度 
dbLdash *= dbUnitRadian; 
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return (-0.09033 + 0.03916 * (cos(dbLdash) + sin(dbLdash)) * tan(latitude)) / ARC SEC PER RADIAN; 


longitude 参数 和 latitude 参数 分 别 是 前 面 计算 得 到 的 地 心 黄 经 和 地 心 黄 纬 ,返回 的 结果 是 地 
心 黄 经 修正 量 AL。 需要 注意 一 点 ，longitude 参数 的 单位 是 弧度 ,需要 转化 成 度 、 分 、 秒 单位 后 
才能 代入 式 (11-14) 进 行 计算 。 


11.2.4 ”误差 修正 一 一 章 动 


经 过 上 述 计 算 转 换 得 到 坐标 值 是 理论 值 ， 或 者 说 是 天 体 的 几何 位 置 , 但 是 FK5 系统 是 一 个 
目 视 系统 ， 也 就 是 说 体现 的 是 人 眼睛 观察 效果 ( 光学 位 置 )， 这 就 需要 根据 地 球 的 物理 环境 、 大 
气 环 境 等 信息 做 进一步 的 修正 ， 使 其 和 人 类 从 地 球 上 观察 星体 的 观测 结果 一 致 。 


首先 需要 进行 章 动 修正 。 章 动 是 指 地 球 沿 自转 轴 的 指向 绕 黄 道 极 缓慢 旋转 过 程 中 ,由 于 地 球 
上 物质 分 布 不 均匀 性 和 月 球 及 其 他 行星 的 摄 动力 造成 的 轻微 抖动 。 英国 天 文学 家 詹姆斯 布 拉 德 
利 (1693 一 1762) 最 早 发 现 了 章 动 ， 章 动 可 以 沿 着 黄道 分 解 为 水 平分 量 和 垂直 分 量 ， 黄 道上 的 水 平 
分 量 记 为 A 小 ， 称 为 黄 经 章 动 ， 它 影响 了 天 球 上 所 有 天 体 的 经 度 。 黄 道上 的 竺 直 分 量 记 为 As ， 
称 为 交角 章 动 ， 它 影响 了 黄 赤 交角 。 有 目前 编制 天 文 年 历 所 依据 的 章 动 理 论 是 伍 拉 德 在 1953 年 建 
立 的 ， 它 是 以 刚体 地 球 模型 为 基础 的 。1977 年 ， 国 际 天 文联 合 会 的 一 个 专家 小 组 建议 采用 非 刚 
体 地 球 模型 一 一 莫 洛 坚 斯 基 I 模型 代替 刚体 地 球 模型 计算 章 动 ，1979 年 的 国际 天 文学 联合 会 第 
十 七 届 大 会 正式 通过 了 这 一 建议 ， 并 决定 于 1984 年 正式 实施 。 

地 球 章 动 主要 是 月 球 运 动 引起 的 , 也 具有 一 定 的 周期 性 ,可 以 描述 为 一 些 周 期 项 的 和 ， 主 要 
项 的 周期 是 6798.4 日 (18.6 年 )， 但 其 他 项 是 一 些 短 周 期 项 (小 于 10 天 )。 本 文采 用 的 计算 方法 
取 自 国际 天 文联 合 会 的 IAU1980 章 动 理论 ， 周 期 项 系数 数据 来 源 于 《天 文 算法 》 一 书 第 21 章 的 
表 21-A， 该 表 忽略 了 IAU1980 章 动 理论 中 系数 小 于 0.0003 "的 周期 项 ， 因 此 只 有 63 项 。 每 个 周 
期 项 包括 计算 黄 经 章 动 4 A 汕 ) 的 正弦 系数 (相位 内 项 系数 )、 计 算 交 角 章 动 的 ( A s ) 余弦 系 
数 ( 相位 外 项 系数 ) 以 及 计算 辐 角 的 5 个 基本 角 距 (M、M'、D、F、0 ) 的 线性 组 合 系数 。5 个 
基本 角 距 的 计算 公式 分 别 如 下 所 示 。 


平 距 角 (日 月 对 地 心 的 角 距 离 ) 计算 公式 : 


D =297.85036 + 455267.111480 * T— 0.0019142 * T2 +T3 /189474 (11-17) 
太阳 (地球 ) 平 近 点 角 计 算 公 式 : 

M=357.52772 + 35999.050340 * T— 0.0001603 * 一 T /1300000 (11-18) 
月 球 平 近 点 角 计算 公式 : 

M'= 134.96298 + 477198.867398 * T+0.0086972 * T?+T3/56250 (11-19) 


月 球 纬度 参数 计算 公式 : 
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下 = 93.27191 + 483202.017538 * T ~ 0.0036825 * T2 +T3 1327270 (11-20) 
黄道 与 月 球 平 轨道 升 交点 黄 经 : 
Q= 125.04452 - 1934.136261*T - 0.0020708 * T?+T3/450000 (11-21) 


以 上 各 式 中 的 是 颂 略 世纪 数 , 计算 出 来 的 5 个 基本 角 距 的 单位 都 是 度 , 在 计算 正 弱 或 余弦 
时 要 转换 为 弧度 单位 。 计算 每 一 个 周期 项 的 黄 经 章 动 过 程 是 这 样 的 ,首先 用 式 (11-17) 至 式 (11-20) 
计算 出 5 个 基本 角 距 ， 然 后 将 计算 出 来 的 值 与 对 应 的 5 个 基本 角 距 系数 组 合 ， 计 算出 辐 角 6。 以 
本 节 使 用 的 章 动 周期 项 系数 表 中 的 第 七 项 为 例 ，5 个 基本 角 距 对 应 的 系数 分 别 是 1、0、-2、2 
和 2， 则 辐 角 9 的 值 就 是 : 


-2D+M+2F+20 
计算 出 辐 角 后 就 可 以 使 用 式 (11-22) 计 算 周期 项 的 值 : 


S=(S1+ S2* T) * sin(O) (11-22) 
使 用 式 (11-22) 计 算出 各 周期 项 的 值 后 累加 求 和 就 可 得 到 黄 经 章 动 , 注意 , 黄 经 章 动 的 单位 是 
0.0001", 对 地 心 黄 经 进行 修正 时 需要 转换 成 弧度 单位 。 交 角 章 动 的 计算 方法 与 黄 经 章 动 的 计算 类 
似 ， 辐 角 2 的 值 是 一 样 的 ， 只 是 计算 章 动 使 用 的 是 余弦 系数 : 
C=(C1+C2*T)*cos(O) (11-23) 
CalcEarthLongitudeNutation() 负数 计算 黄 经 章 动 ， 计 算 交 角 章 动 的 算法 实现 与 之 类 似 。 
GetEarthNutationParameter() 辅 助 函 数 用 于 计算 5 个 基本 角 距 ,就 是 式 (11-17) 至 式 (11-20) 的 具体 实 
现 。 最 终 计算 的 结果 已 经 转换 成 弧度 单位 ， 可 以 直接 对 之 前 已 经 转换 到 FK5 系统 的 地 心 黄 经 进行 
章 动 修正 。 


double CalcEarthLongitudeNutation(double dt) 
{ 


double T = dt * 10; 
double D,M,Mp,F,Omega; 


GetEarthNutationparameter(dt, &D, 8&M, 8Mp, &F, &Omega); 
double resulte = 0.0 ; 


for(int i = 0; i «< COUNT OF(nutation); i++) 
{ 


double sita = nutation[i].D * D + nutation[i].M * M + nutation[i].Mp * Mp + nutation[i].F * 
F + nutation[i].omega * Omega; 
sita = DegreeToRadian(sita); 


resulte += (nutation[i].sine1 + nutation[i].sine2 * T ) * sin(sita); 


LE 


/# 先 乘 以 章 动 表 的 系数 0.001"， 然 后 换算 成 弧度 的 单位 */ 
return resulte * 0.0001 / ARC SEC PER RADIAN; 
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11.2.5 ”误差 修正 一 一 光 行 差 


除了 章 动 修正 ,对 于 目测 系统 来 说 ,还 要 进行 光 行 差 修正 。 光 行 差 是 指 在 同一 瞬间 ,运动 中 
的 观察 者 所 观测 到 的 天 体 视 方 向 与 静止 的 观测 者 所 观测 到 天 体 的 真 方 向 之 差 。 造成 光 行 差 的 原 
有 两 个 , 一 个 是 光 的 有 限 速 度 , 男 一 个 是 观察 者 的 运动 。 在 地 球 上 的 天 文 观测 者 因 和 地 球 一 起 运 
动 (自转 + 公转 )， 他 所 看 到 的 星光 方向 与 假设 地 球 不 动 时 看 到 的 方向 不 一 样 。 以 太阳 为 例 ， 光 
线 从 太阳 传 到 地 球 需 要 约 8 分 钟 的 时 间 , 在 这 8 分 钟 多 的 时 间 中 ,地球 沿 着 公转 轨道 移动 了 一 段 
距离 ， 人 们 根据 现在 的 观察 认定 太阳 在 那个 视 位 置 ， 事 实 上 那 是 8 分 钟 前 太阳 的 位 置 。 在 精确 的 
天 文 计算 中 , 需要 考虑 这 种 光 行 差 引起 的 视 位 置 差异 , 在 计算 太阳 的 地 心 视 黄 经 时 ， 要 对 其 进行 
光 行 差 修 正 。 地 球 上 的 观测 者 可 能 会 遇 到 几 种 光 行 差 ,分 别 是 因 地 球 公转 引起 的 周年 光 行 差 ， 
地 球 自转 引起 的 周 日 光 行 差 , 还 有 因 太阳 系 或 银河 系 运动 形成 的 长 期 光 行 差 等 , 对 于 从 地 球 上 观 
察 太 阳 这 种 情况 ， 只 需要 考虑 周年 光 行 差 和 周 日 光 行 差 。 因 太阳 公转 速度 比较 快 ,周年 光 行 差 最 
大 可 达到 20.5 角 秒 ， 在 计算 太阳 视 黄 经 时 需要 考虑 修正 。 地 球 自转 速度 比较 慢 ， 周 日 光 行 差 最 
大 约 为 零点 儿 个 角 秒 ， 因 此 计算 太阳 视 黄 经 时 忽略 周 日 光 行 差 。 


下 面 是 一 个 粗略 计算 太阳 地 心 黄 经 光 行 差 修正 量 的 公式 ， 其 中 R 是 地 球 和 太阳 的 距离 : 


AC=—20"4898/R (11-24) 

分 子 20.4898 并 不 是 一 个 常数 , 但 是 其 值 的 变化 非常 缓慢 , 在 0 年 是 20”.4893, 在 4000 年 是 
20"4904。 前 面 提 到 过 ， 太 阳 到 地 球 的 距离 R 可 以 用 VSOP87D 表 的 R0 ~ RS 周期 项 计算 出 来 ，R 
的 单位 是 “天 文 单位 ”( AU )， 和 计算 太阳 地 心 黄 经 和 地 心 黄 纬 类 似 ， 太 阳 到 地 球 的 距离 可 以 这 
样 算出 来 : 


double CalcSunEarthRadius(double dt) 


double RO = CalcperiodicTerm(Earth RO, COUNT OF(Earth RO), dt); 
double R1 = CalcPeriodicTerm(Earth R1, COUNT OF(Earth R1), dt); 
double R2 = CalcPeriodicTerm(Earth R2, COUNT OF(Earth R2), dt); 
( _R3), dt); 
( _R4), dt); 


double R3 = CalcPeriodicTerm(Earth R3, COUNT OF(Earth R 
double R4 = CalcPeriodicTerm(Earth R4, COUNT OF(Earth R 


了》 


double R = (((((R4 * dt) + R3) * dt + R2) * dt + R1) * dt + RO) / 100000000.0; 


return R; 
} 
计算 出 太阳 到 地 球 的 距离 之 后 ,就 可 以 使 用 式 (11-24) 计 算 光 行 差 修 正 量 。 式 (11-24) 计 算出 的 
结果 是 度 、 分 、 秒 单位 ( 角 秒 )， 需 要 转换 成 弧度 单位 ， 这 个 转换 在 AdjustSunEclipticLongitude 
Aberration() 函 数 中 体现 。 


double AdjustSunEclipticLongitudeAberration(double dt) 


double dtmp = -20.4898 / CalcSunEarthRadius(dt); 
return dtmp / ARC SEC PER RADIAN; 
} 
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11.2.6 用 牛顿 迭代 法 计算 二 十 四 节气 


由 VSOP87 理论 计算 出 来 的 几何 位 置 黄 经 , 经 过 坐标 转换 , 章 动 修正 和 光 行 差 修正 后 ,就 可 
以 得 到 比较 准确 的 太阳 地 心 视 黄 经 , GetSunEclipticLongitudeEC() 函 数 就 是 整个 过 程 的 体现 , 参数 
dt 是 儒 略 千年 数 ， 它 与 儒 略 日 的 计算 关系 在 11.2.3 节 已 经 给 出 。 


double GetSunEclipticLongitudeEC(double dt) 
{ 


// 计算 太阳 的 地 心 黄 经 
double longitude = CalcSunEclipticLongitudeEC(dt); 


// 计算 太阳 的 地 心 黄 纬 
double latitude = CalcSunEclipticLatitudeEC(dt); 


// 校 正经 度 
ongitude += AdjustSunEclipticLongitudeEC(dt, longitude, latitude); 


// 天 体 章 动 修正 
ongitude += CalcEarthLongitudeNutation(dt); 


/* 太 阳 地 心 黄 经 光 行 差 修 正 */ 
ongitude += AdjustSunEclipticLongitudeAberration(dt); 


return longitude; 


到 现在 为 止 ， 我 们 已 经 知道 如 何 使 用 VSOP82/87 理论 计算 以 儒 略 日 为 单位 的 任意 时 刻 的 太 
阳 地 心 视 黄 经 , 但 是 这 和 实际 历法 计算 需求 还 不 一 致 ， 历 法 计算 需要 根据 太阳 地 心 视 黄 经 反 求 出 
此 时 的 时 间 。VSOP82/87 理论 没有 提供 反 向 计算 的 方法 , 但 是 可 以 采用 根据 时 间 正 向 计算 太阳 视 
黄 经 ， 配 合 误差 修正 进行 近代 计算 的 方法 , 使 正 向 计算 出 来 的 结果 疝 已 知 结果 收敛 ， 当 达到 一 定 
的 迭代 次 数 或 计算 结果 与 已 知 结果 误差 满足 精度 要 求 时 , 停止 迭代 ,此 时 的 正 向 输入 时 间 就 是 所 
求 的 时 间 。 地 球 公转 轨道 是 近似 椭圆 轨道 ,轨道 方程 不 具备 单调 性 , 但 是 在 某 个 节气 附近 的 一 小 
段 时 间 区 间 中 ， 轨 道 方程 具有 单调 性 ， 这 个 是 本 节 和 迭代 算法 的 基础 。 

实际 上 , 我 们 要 做 的 事情 就 是 求解 方程 的 根 , 但 是 我 们 面临 的 这 个 方程 没有 解析 表达 式 , 更 
不 用 说 求 根 公 式 了 。 本 书 第 13 章 介绍 了 几 种 迭代 法 求解 非 线 性 方程 的 方法 ， 都 适用 于 我 们 现在 
面临 的 问题 。 牛 顿 迭 代 法 具有 收敛 速度 快 、 稳 定 的 特点 ， 所 以 我 们 选择 使 用 牛顿 迭代 法 求解 这 个 
问题 。 使 用 牛顿 迭代 法 首先 要 定义 函数 fx)。 我 们 观察 GetSunEclipticLongitudeEC() 函 数 ， 参 数 
dt 是 一 个 与 时 间 有 关 的 变量 , 返回 值 是 一 个 角度 值 ( 太阳 的 地 心 视 黄 经 ), 如 果 将 路 视 为 自 变 量 ， 
返回 值 angle 视 为 结果 ， 则 fx) 可 定义 为 : 
f(x) = GetSunEclipticLongitudeEC(x) - angle 
angle 是 节气 对 应 的 地 心 黄 经 角度 ， 对 每 个 节气 来 说 ，angle 是 个 常量 。 定 义 了 fx)， 就 可 以 写 出 
牛顿 欠 代 关系 : 


Nnt1 一 Xn — Ax)/f (xn) 
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确定 了 方程 fx)， 剩 下 的 问题 就 是 求 导 了 肾 数 f'(x)。 严 格 的 求解 ， 应 该 根据 
GetSunEclipticLongitudeEC() 函 数 ,， 以 儒 略 千年 数 dt 为 自 变 量 , 按照 函数 求 导 的 规则 求 出 导 函 数 。 
因为 GetsunEclipticLongitudeEC() 函 数 内 部 是 调用 其 他 函数 ， 因 此 可 以 理解 为 是 一 个 多 个 函数 组 
合 的 复合 函数 ， 类 似 fx) = g00) + h(x, k(x)) +p() 这 样 的 形式 ， 可 以 按照 求 导 规则 逐步 对 其 求 导 得 
到 导 函 数 。 但 是 我 不 打算 这 人 么 做 ， 因 为 有 更 简单 的 方法 。 第 13 章 介 绍 牛 顿 迭 代 法 一 节 介 绍 了 求 
一 阶 导 数 的 近似 公式 ,其实 求 导 函 数 的 目的 就 是 为 了 得 到 某 一 点 的 导数 ,如果 有 近似 公式 可 以 直 
接 得 到 这 一 点 的 导数 ， 就 不 用 费劲 求 导 函 数 了 。 有 关 近 似 公式 的 说 明 可 参考 第 13 章 对 近似 公式 
的 描述 ， 这 里 就 直接 用 了 : 
Po = xo + 0.000005) — fro — 0.000005)) / 0.00001 (11-25) 
牛顿 迭代 法 在 进行 迭代 求解 时 ， 需 要 指定 一 个 迭代 初始 值 ， 初 始 值 的 选择 越 接 近 问 题 的 解 ， 
迭代 收敛 的 速度 就 越 快 。 当 我 们 求 一 个 节气 的 准确 时 间 时 , 我 们 希望 从 一 个 比较 接近 准确 时 间 的 
时 间 开 始 迭 代 。 根 据 节 气 日 期 的 规律 ,每 个 月 的 节气 时 间 比 较 固定 ,最 多 相 差 一 两 天 ， 考虑 到 几 
千年 后 岁差 的 影响 ， 这 个 估算 范围 还 可 以 再 放宽 一 点 。 比 如 ， 对 于 月 内 的 第 一 个 节气 ， 可 以 将 时 
间 范 围 估算 为 4 日 到 9 日， 对 于 月 内 的 第 二 个 节气 ， 可 以 将 时 间 范 围 估算 为 16 日 到 24 日 ， 保 证 
迭代 范围 内 有 解 。 为 此 , 我 们 取 第 一 个 节气 时 间 为 每 月 的 6 日 ， 第 二 个 节气 时 间 为 每 月 的 20 日 。 
根据 节气 的 规律 ， 我 们 知道 节气 和 月 份 存在 对 应 关系 ， 因 此 根据 节气 对 应 的 太阳 地 心 黄 经 角度 ， 
可 以 反 推 出 月 份 。 结 合 指定 的 年 份 、 根 据 节气 反 推 出 来 的 月 份 和 估计 的 日 期 ， 就 可 以 计算 出 儒 略 
日 ， 这 个 就 是 迭代 的 初始 值 。 佑 算 迭 代 初 始 值 的 算法 就 体现 在 GetInitialEstimateSolarTerms() 函 
数 内 ，angle 参数 就 是 节气 对 应 的 太阳 地 心 视 黄 经 ， 这 个 角度 值 和 节气 是 固定 的 对 应 关系 。 


double GetInitialEstimateSolarTerms(int year, int angle) 


int STMonth = int(ceil(double((angle + 90.0) / 30.0))); 
STMonth = STMonth > 12 ? STMonth - 12 : STMonth; 


/* 每 月 第 一 个 节气 发 生日 期 基本 都 -9 日 之 间 ， 第 二 个 节气 的 发 生日 期 都 在 一 日 之 间 */ 
if((angle % 15 == 0) && (angle % 30 != 0)) 
{ 


return CalculateJulianDay(year, STMonth, 6, 12, 0, 0.00); 


} 


else 


{ 


return CalculateJulianDay(year, STMonth, 20, 12, 0, 0.00); 
} 
} 


有 了 求 导 数 的 近似 公式 ， 有 了 迭代 初始 值 ， 就 可 以 根据 牛顿 迭代 关系 写 出 迭代 求解 的 算法 ， 
正如 你 在 CalculateSolarTerms() 函 数 中 看 到 的 那样 ,非常 简单 。 唯 一 需要 特殊 说 明 的 是 , 由 于 角度 
的 360 度 圆 周 性 ， 当 在 太阳 黄 经 0 度 附 近 逼 近 时 ,迭代 可 能 是 从 (345, 360] 和 [0, 15) 两 个 方向 上 向 0 
通 近 ， 此 时 需要 将 (345, 360] 区 间 修 正 为 (-15, 0]， 使 得 逼近 区 间 边 界 的 选取 能 够 正常 进行 。 经 过 验 
证 ， 牛 顿 迭 代 法 具有 非常 好 的 收敛 效果 ， 一 般 只 需 3 次 迭代 就 可 以 得 到 满足 精度 的 结果 。 


double CalculateSolarTerms(int year, int angle) 
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{ 
double JDO, JD1,stDegree, stDegreep; 


JD1 = GetInitialEstimateSolarTerms(year, angle); 
do 
{ 
JDO = JD1; 
stDegree = GetSunEclipticLongitudeEC(JD0O); 
党 
对 黄 经 度 和 迭代 逼近 时 ， 由 于 角度 度 圆 周 性 ， 估 算 黄 经 值 可 能 在 (345,360] 和 [0,15) 两 个 区 间 ， 如 果 值 
落 入 前 一 个 区 间 ， 需 要 进行 修正 


stDegree = ((angle == 0) && (stDegree > 345.0)) ? stDegree - 360.0 : stDegree; 
stDegreep = (GetSunEclipticLongitudeEC(JDO + 0.000005) 
- GetSunEclipticLongitudeEC(JDO - 0.000005)) / 0.00001; 
JD1 = ]D0 - (stDegree - angle) / stDegreep; 
}while((fabs(JD1 - JDO) > 0.0000001)); 


return JD1; 


} 

至 此 , 我 们 就 有 了 完整 的 计算 节气 发 生 时 间 的 方法 , 输入 年 份 和 节气 对 应 的 太阳 黄 经 度数 ， 即 
可 求 的 该 节气 发 生 的 精确 时 间 。 最 后 说 明 一 下 ， 以 上 算法 中 讨论 的 时 间 都 是 力学 时 时 间 (TD )"， 
与 国际 协调 时 ” (UTC ) 以 及 各 个 时 区 的 本 地 时 间 都 有 不 同 ， 需 要 将 计算 出 的 结果 转换 成 国际 协调 
时 , 然后 再 调整 到 适当 的 时 区 ,比如 中 国 的 中 原 地 区 就 是 东 八 区 标准 时 (UTC+ 8 )。 应 用 本 节 的 算 
法 计算 出 2012 年 各 个 节气 的 时 间 如 下 (已 经 转换 为 东 八 区 标准 时 ), 与 紫金 山 天 文 台 发 布 的 《2012 
中 国 天 文 年 历 》 中 发 布 的 时 间 在 分 钟 级 别 上 完全 吻合 ( 此 年 历 只 精确 到 分 钟 ): 


2012-01-06，06:43:54.28 “小寒 
2012-01-21，00:09:49.08 “大 塞 
2012-02-04，18:22:22.53 立春 


11.3 ”农历 朔 日 (新 月 的 天 文学 计算 


除了 公历 的 一 些 算法 , 本章 还 要 介绍 中 国 农历 的 天 文 计算 , 农历 是 一 种 极 具 中 国 特色 的 日 月 
结合 的 历法 。 中 国 农历 的 朔望月 是 农历 历法 的 基础 ， 而 朔望月 又 是 严格 以 日 月 合 朔 发 生 的 那 一 天 


@ 力学 时 ， 全 称 是 “牛顿 力学 时 ”， 也 称 作 “ 历 书 时 ”。 它 描述 天 体 运 动 的 动力 学 方程 中 作为 时 间 自 变量 所 体现 的 时 
间 ， 或 天 体 历 表 中 应 用 的 时 间 ， 是 由 天 体力 学 的 定律 确定 的 均匀 时 间 。 力 学 时 的 初始 历 元 取 为 1900 年 初 附 近 ， 太 
阳 几 何平 黄 经 为 279"4148".04 的 瞬间 ， 秒 长 定义 为 1900.0 年 回归 年 长 度 的 1 /31556925.9747。1958 年 国际 天 文 
学 联合 会 决议 决定 : 自 1960 年 开始 用 力学 时 代替 世界 时 作为 基本 的 时 间 计 量 系统 ， 规 定 天 文 年 历 中 太阳 系 天 体 的 
位 置 都 按 力学 时 推算 。 力 学 时 与 世界 时 之 差 由 观测 太阳 系 天 体 ( 主要 是 月 球 ) 定 出 , 因此 力学 时 的 测定 精度 较 低 ， 
1967 年 起 被 原子 时 代替 作为 基本 时 间 计 量 系统 。 

@) 国际 协调 时 又 称 世 界 时 ， 是 以 本 初子 午 线 的 平子 夜 起 算 的 平 太阳 时 ， 又 称 格 林 威 治 时 间 。 世 界 各 地 地 方 时 与 世界 

时 之 差 等 于 该 地 的 地 理 经 度 。 世 界 时 1960 年 以 前 曾 作为 基本 时 间 计 量 系统 被 广泛 应 用 。 由 于 地 球 自转 速度 变化 的 

影响 ， 它 不 是 一 种 均匀 的 时 间 系 统 。 后 来 世界 时 先后 被 历 书 时 和 原子 时 所 取代 。 
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作为 月 首 ， 因 此 日 月 合 朔 时 间 的 计算 是 制定 农历 历法 的 关键 。 本 节 将 介绍 ELP-2000/82 月 球 运行 
理论 ， 以 及 如 何 用 ELP-2000/82 月 球 运行 理论 计算 日 月 合 朔 时 间 。 


11.3.1 日 月 合 朔 的 天 文学 定义 


要 计算 日 月 合 朔 时 间 , 首先 要 对 日 月 合 朔 这 一 天 文 现象 进行 数学 定义 。 朔望月 是 在 地 球 上 观 
察 到 的 月 相 周期 ， 平 均 长 度 约 等 于 29.53059 日 ， 而 恒星 月 ( 天 文 月 ) 是 月 亮 绕 地 球 公转 一 周 的 
时 间 ， 长 度 约 27.32166 日 。 月 相 周 期 长 度 比 恒星 月 长 大 约 两 天 ， 这 是 因为 在 月 球 绕 地 球 旋转 一 
周 的 同时 ， 地 球 还 带 着 它 绕 太 阳 旋 转 了 一 定 的 角度 的 缘故 ， 所 以 月 相 周 期 不 仅 与 月 球 运行 有 关 ， 
还 和 太阳 运行 有 关 。 日 月 合 朔 的 时 候 ， 太 阳 、 月 亮 和 地 球 三 者 接近 一 条 直线 ,月 亮 未 被 照 亮 的 一 
面 对 着 地 球 ， 因 此 地 球 上 看 不 到 月 亮 ， 此 时 又 被 称 为 新 月 。 图 11-3a 就 是 日 月 合 朔 天 文 现象 的 示 


意图 
VD [3 


图 11-3 日 月 天 文 现象 示意 图 
月 亮 绕 太阳 公转 的 白道 面 和 地 球 绕 太 阳 公 转 的 黄道 面 存在 一 个 最 大 约 5° 的 夹 角 ， 因 此 大 多 数 


情况 下 , 日 月 合 朔 时 都 不 是 严格 在 同一 条 直线 上 , 不 过 也 会 发 生 在 同一 直线 的 情况 ,此 时 就 会 发 生 
日 食 。 图 11-3b 显示 了 日 月 合 朔 时 侧切 面 上 月 亮 的 三 种 可 能 的 位 置 情况 ， 当 月 亮 处 在 位 置 2 时 就 会 
发 生日 食 。 由 图 11-3 可 知 ， 日 月 合 朔 的 数学 定义 就 是 太阳 和 月 亮 的 地 心 视 黄 经 差 为 0 的 时 刻 。 


11.3.2 “ELP-2000/82 月 球 理论 


要 计算 日 月 合 朔 , 需要 知道 太阳 地 心 视 黄 经 和 月 亮 地 心 视 黄 经 的 计算 方法 。 本 章 11.2 节 已 经 
介绍 了 如 何 用 VSOP82/87 行 星 理论 计算 太阳 的 地 心 视 黄 经 , 本 节 将 介绍 如 何 用 ELP-2000/82 月 球 
理论 计算 月 亮 的 地 心 视 黄 经 。 有 了 太阳 地 心 视 黄 经 和 月 亮 地 心 视 黄 经 的 计算 方法 , 就 可 以 反 向 推 
算 它们 相等 的 时 间 ， 这 个 时 间 就 是 日 月 合 朔 的 时 间 。 

ELP-2000/82 月 球 理论 是 M. Chapront-Touze 和 J. Chapront 在 1983 年 提出 的 一 个 月 球 位 置 的 
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半 解 析 理 论 。 和 其 他 半 解 析 理 论 一 样 ，ELP-2000/82 理论 也 包含 一 套 计 算 方法 和 相应 的 迭代 周期 
项 。 这 套 理论 共 包 含 37862 个 周期 项 ,其 中 20560 个 用 于 计算 月 球 经 度 , 7684 个 用 于 计算 月 球 纬 
度 ，9618 个 用 于 计算 地 月 距离 。 但 是 这 些 周期 项 中 有 很 多 都 是 非常 小 的 值 ， 例 如 一 些 计算 经 纬 
度 的 项 对 结果 的 增益 只 有 0.00001 角 秒 ,还 有 一 些 地 月 距离 周期 项 对 距离 结果 的 增益 只 有 0.02 米 ， 
对 于 精度 不 高 的 历法 计算 ,完全 可 以 忽略 。 

有 很 多 基于 ELP-2000/82 月 球 理论 的 改进 或 简化 理论 ,《 天文 算法 》 一 书 的 第 四 十 五 章 就 介 
绍 了 一 种 改进 算法 ， 其 周期 项 参数 都 是 从 ELP-2000/82 理论 的 周期 项 参数 转换 来 的 ， 忽略 了 小 的 
周期 项 。 使 用 该 方法 计算 的 月 球 黄 经 精度 只 有 10"， 月 亮 黄 纬 精度 只 有 4"， 但 是 只 用 计算 60 个 
周期 项 ， 速 度 很 快 ， 本 节 就 采用 这 种 修改 过 的 ELP-2000/82 理论 计算 月 亮 的 地 心 视 黄 经 。 这 种 计 
算 方法 的 周期 项 分 三 部 分 , 分 别 用 来 计算 月 球 黄 经 、 月 球 黄 纬 和 地 月 距离 ， 三 部 分 的 周期 项 的 内 
容 一 样 ， 由 四 个 计算 辐 角 的 系数 和 一 个 正弦 (或 余弦 ) 振幅 组 成 。 计 算 月 球 黄 经 和 月 球 黄 纬 使 用 
正弦 表达 式 求 和 : 


A* sin(O) (11-26) 
计算 地 月 距离 用 余弦 表达 式 求 和 : 
4# cos(O) (11-27) 
其 中 辐 角 0 的 计算 公式 是 : 
0=a*D+b*Mtc*M'+d*F (11-28) 


式 (11-28) 中 的 四 个 辐 角 系数 a、b、c 和 4 由 每 个 迭代 周期 项 给 出 ,日 月 距 角 D、 太 阳平 近 地 
角 M、 月 亮 平 近 地 角 M' 以 及 月 球 生 交点 平角 距 正则 分 别 由 式 (11-29) 至 式 (11-32) 进 行 计算 ; 
D = 297.8$02042 + 445267.1115168*T - 0.0016300#T2 + 


T3/1545868 —T*/113065000 (11-29) 
M=357.5291092 + 35999.0502909*T - 0.0001536*T? 十 
T /24490000 (11-30) 
M'= 134.9634114 + 477198.8676313*T + 0.0089970*T? 十 
T3/69699 — T*/14712000 (11-31) 
F= 93.2720993 + 483202.0175273 * 一 0.0034029*T? - 
T*/3526000+T/863310000 (11-32) 


以 上 各 式 计算 结果 的 单位 是 度 ， 其 中 的 了 是 侍 略 世纪 数 ， 它 与 侍 略 千年 数 的 关系 及 计算 方 
法 已 经 在 11.2.3 节 给 出 。 以 计算 月 球 黄 经 的 周期 项 第 二 项 的 计算 为 例 ， 第 二 项 数据 分 别 是 : 辐 
角 系 数 a=2, b=0, c= -1，4d= 0， 振 幅 4= 1274027， 黄 经 计算 用 正弦 表达 式 ， 则 五 的 计算 如 
下 所 示 : 


b=1274027 * sin(2D -MI 
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11.3.3 ”误差 修正 一 一 地 球 轨道 离心 率 修正 


在 套用 式 (11-26) 和 式 (11-27) 计 算出 月 球 黄 经 周期 项 和 月 球 黄 纬 周期 项 的 时 候 , 需要 注意 对 包 
含 了 太阳 平 近 地 角 M 的 项 进行 修正 ， 因 为 M 的 值 与 地 球 公转 轨道 的 离心 率 有 关 ， 因 为 离心 率 是 
个 与 时 间 有 关 的 变量 , 导致 振幅 4 实际 上 是 个 变量 , 需要 根据 时 间 进 行 修正 。 月 球 黄 经 周期 项 的 
修正 方法 是 :如 果 辐 角 中 包含 了 MM 或 -M 时 ,需要 乘 以 系数 修正 ;如 果 辐 角 中 包含 了 2M 或 -2M， 
则 需要 乘 以 系数 互 的 平方 进行 修正 。 系 数 五 的 计算 表达 式 如 下 : 


E=1—0.002516* T—0.0000074 * T? (11-33) 
这 个 修正 可 以 在 计算 周期 项 的 时 候 直 接 进 行 ， 以 计算 月 球 黄 经 周期 项 的 算法 实现 函数 为 例 ， 
CalcMoonECLongitudepPeriodic() 函 数 在 计算 每 一 项 周期 项 时 ， 直 接 乘 以 pow(E,fabs(Moon longitude 
[i].M)) 进 行 修正 , 使 用 pow() 函 数 并 不 是 一 个 高 效 的 方法 , 此 处 使 用 pow() 函 数 仅仅 是 为 了 利用 了 
EE 的 0 次 备 结 果 是 1 的 数学 特性 ， 省 去 几 行 代码 ， 大 家 可 自行 体会 。 使 用 式 (11-28) 计 算出 的 辐 角 
sita 是 角度 单位 ， 需 要 转换 成 弧度 单位 才能 调用 sin() 函 数 ， 这 个 在 代码 中 都 有 体现 。 


double CalcMoonECLongitudePeriodic(double D, double M, double Mp, double F, double E) 


double EI = 0.0 ; 


for(int i = 0; i < COUNT OF(Moon longitude); i++) 
{ 
double sita = Moon longitude[il].D * D + Moon longitude[i].M * M + Moon longitude[i].Mp * Mp 
+ Moon longitude[i].F * F; 
sita = DegreeToRadian(sita); 
EI += (Moon longitude[i].eiA * sin(sita) * pow(E, fabs(Moon longitude[i].M))); 
} 


return EI; 

} 

调用 CalcMoonECLongitudeperiodic() 函 数 得 到 地 球 轨道 离心 率 修正 后 的 月 球 黄 经 周期 项 之 和 
27， 计 算 月 球 黄 纬 同样 需要 根据 M 对 周期 项 结果 进行 修正 ， 修 正 的 方法 和 对 月 球 黄 经 的 修正 方 
法 相同 ， 因 此 可 以 使 用 相同 的 方法 得 到 修正 地 球 轨道 离心 率 之 后 的 月 球 黄 纬 周期 项 之 和 3b。 一 
般 来 说 , 计算 地 月 距离 的 目的 是 为 了 计算 月 亮光 行 差 , 但 是 因为 地 月 距离 较 小 ， 从 地 球 观察 月 亮 
产生 的 光 行 差 也 很 小 ， 相 对 于 本 章 介绍 的 历法 的 算法 的 精度 ( 月 球 黄 经 精度 10"， 月 亮 黄 纬 精度 
4") 来 说 ， 可 以 忽略 光 行 差 修正 ， 因 此 就 不 用 计算 地 月 距离 。 


11.3.4 ”误差 修正 一 一 黄 经 摄 动 


金星 轨道 距离 地 月 系 轨道 比较 近 , 金星 的 运行 会 对 月 球 的 运行 产生 摄 动 影响 。 木星 的 轨道 虽 
然 距离 地 月 系 轨道 远 一 点 , 但 是 质量 大 ， 因 此 木星 的 运行 同样 会 对 月 球 的 运行 产生 摄 动 影响 。 与 
此 同时 , 因为 地 球 不 是 一 个 规则 的 刚性 球体 , 因此 地 球形 状 的 不 规则 性 也 会 对 月 球 的 运行 产生 影 
响 ， 这 些 影 响 会 导致 月 球 运行 时 产生 黄 经 摄 动 ， 因 此 需要 对 计算 出 的 月 球 黄 经 周期 项 和 27 与 月 
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球 黄 纬 周期 项 和 2b 进行 摄 动 修正 ， 修 正 的 方法 如 下 : 


Z/ += +3958*sin(A1) + 1962*sin(L'— F) + 318*sin(A,) (11-34) 
3b +=—223S*sin(L") + 382*sin(A3) + 17S*sin(A1 — HF) +175*sin(A1 +F) 
+ 127*sin(L'— M")— 115*sin(L'+ M'") (11-35) 


其 中 MY 和 五 分 别 由 式 (11-31) 和 式 (11-32) 计 算得 到 , 工 是 月 球 平 黄 经 ， 计 算 方法 是 : 


L'=218.3164591 + 481267.88134236*T — 0.0013268*T +T 1538841-T /65194000 (11-36) 
41 是 与 金星 相关 的 摄 动 角 修 正 量 ，4, 是 与 木星 相关 的 摄 动 角 修 正 量 ,，L'" 和 43 是 与 地 球 扁 率 
摄 动 相关 的 摄 动 角 修 正 量 ， 这 三 个 修正 量 的 计算 方法 如 下 : 


A1=119.75 + 131.849 *T (11-37) 
A; = 53.09 + 479264.290 *T (11-38) 
A; =313.45 + 481266.484 * T (11-39) 


月球 地 心 黄 经 摄 动 的 修正 使 用 式 (11-34) 给 出 的 方法 计算 ,实现 算法 如 下 : 


double CalcMoonLongitudePerturbation(double dt, double Lp, double F) 
{ 


double T = dt; /*T 是 从 ]2000 起 算 的 儒 略 世纪 数 */ 
double A1 = 119.75 + 131.849 * T; 

double A2 = 53.09 + 479264.290 * T; 

double result = 3958.0 * sin(DegreeToRadian(A1)); 
result += (1962.0 * sin(DegreeToRadian(Lp - F))); 
result += (318.0 * sin(DegreeToRadian(A2))); 


return result; 


} 

CalcMoonLongitudepPerturbation() 函 数 计 算出 的 结果 是 摄 动 修正 量 ， 最 后 需要 将 这 个 结果 与 前 
面 计 算出 来 的 月 球 黄 经 周期 项 和 到 进行 琶 加 , 得 到 修正 后 的 结果 。 再 次 提醒 一 下 , 根据 式 (11-37) 
和 式 (11-38) 计 算出 来 的 4 和 4 单位 是 度 ， 需 要 转换 为 弧度 才能 调用 sin() 函 数 进行 计算 。 


11.3.5 月球 地 心 视 黄 经 和 最 后 的 修正 一 一 地 球 章 动 
完成 所 有 的 修正 之 后 ,需要 对 焉 和 5b 进行 最 后 的 计算 ,得 到 月 球 地 心 视 黄 经 4 和 月 球 地 心 
视 黄 纬 8， 这 个 最 后 的 计算 公式 如 下 所 示 : 
414=L+¥1/1000000.0 (11-40) 
B=¥b/1000000.0 (11-41) 


工 是 用 式 (11-36) 计 算出 来 的 月 球 平 黄 经 。 对 焉 和 5b 除 以 1000000.0 的 原因 是 周期 项 系数 中 
振幅 4 的 单位 是 0.000001 度 。 最 终 得 到 的 月 球 地 心 视 黄 经 4 和 月 球 地 心 视 黄 纬 8 的 单位 是 度 。 


11.3 农历 朔 日 (新 月 ) 的 天 文学 计算 号 151 


到 此 并 没有 结束 ， 还 有 一 项 修正 需要 考虑 。 前 面 已 经 提 到 过 ， 地 球 不 是 圆 球 刚体 ， 其 不 规则 
形状 会 对 在 地 球 上 的 目 视 观察 系统 产生 影响 ， 那 就 是 地 球 的 章 动 。11.2.4 节 已 经 介绍 过 地 球 章 动 
对 太阳 地 心 视 黄 经 的 影响 和 修正 算法 ， 该 算法 对 月 球 的 地 心 视 黄 经 同样 适用 。11.2.4 节 已 经 给 出 
了 地 球 章 动 对 黄 经 的 修正 的 实现 函数 CalcEarthLongitudeNutation(), 将 这 个 结果 肢 加 到 之 前 计算 
出 的 月 球 地 心 视 黄 经 4 上 即 可 完成 章 动 修正 。 对 于 月 球 地 心 黄 纬 , 同样 要 适用 交角 章 动 进行 修正 ， 
但 是 计算 如 月 合 朔 只 需要 计算 月 球 地 心 黄 经 即 可 ， 对 月 球 地 心 黄 纬 的 修正 算法 此 处 就 不 列 出 了 ， 
读者 可 在 本 书 的 配套 代码 中 找到 它们 。 


完整 的 周期 项 计算 、 修 正 并 最 后 转换 出 月 球 地 心 视 黄 经 结果 的 算法 实现 就 是 函数 GetMoonE 
clipticLongitudeEC()。 参 数 dbJD 是 指定 时 间 的 颂 略 日 ， 返 回 结 果 是 月 球 地 心 视 黄 经 ， 单 位 是 度 。 
double GetMoonEclipticLongitudeEC(double dbJD 


Dees 


{ 
double Lp,D,M,Mp,F,E; 
double dt = (db]D - JD2000) / 36525.0; /* 儒 略 世纪 数 */ 
GetMoonEclipticparameter(dt, 8&Lp, &D, 8M, &Mp, &F, &E); 
/* 计 算 月 球 地 心 黄 经 周期 项 */ 
double EI = CalcMoonECLongitudeperiodic(D, M, Mp, F, E); 
/# 修 正 金 星 、 木 星 以 及 地 球 扁 率 摄 动 #/ 
EI += CalcMoonLongitudePerturbation(dt, Lp, F); 
/* 计 算 月 球 地 心 视 黄 经 */ 
double longitude = Lp + EI / 1000000.0; 
/* 计 算 天 体 章 动 干扰 */ 
longitude += RadianToDegree(CalcEarthLongitudeNutation(dt / 10.0)); 
return longitude,; 

} 


11.3.6 ”用 牛顿 迭代 法 计算 日 月 合 逆 


至 此 , 我 们 有 了 用 半 解 析 理 论 计算 月 球 地 心 视 黄 经 的 算法 , 但 是 和 节气 的 计算 一 样 ， 历 法 的 
计算 需要 根据 月 球 的 地 心 视 黄 经 反 推 对 应 的 时 间 , 这 就 像 解 方 程 一 样 , 我 们 仍然 需要 一 个 反 向 计 
算 的 结果 。 为 此 ， 我 们 再 次 选择 牛顿 迭代 法 。 使 用 牛顿 迭代 法 ， 需 要 指定 函数 fx)。 日 月 合 朔 的 
天 文 定义 是 太阳 地 心 视 黄 经 和 月 球 地 心 视 黄 经 相等 的 那 一 刻 ， 也 就 是 它们 的 差 值 是 0 的 那 一 刻 ， 
于 是 我 们 这 样 确定 fx): 

f(x) = GetSunEclipticLongitudeEC(x) - GetMoonEclipticLongitudeEC(x) 

我 们 需要 求解 ftx) = 0 的 时 候 的 解 x， 这 个 x 其 实 就 是 对 应 的 儒 略 日 时 间 。 

牛顿 迭代 关系 和 一 阶 导数 近似 公式 请 参看 11.2.6 节 的 方法 , 这 里 不 再 袭 述 。 这 个 算法 需要 注 
意 的 地 方 就 是 角度 的 360 度 周期 性 , 在 0 度 (360 度 ) 附近 要 特殊 处 理 ,处理 的 方法 就 是 按照 360 


152 b> 第 11 章 算法 与 历法 


圆 整 ， 避免 从 角度 理解 应 该 是 很 接近 的 两 个 值 ， 相 减 的 结果 却 是 一 个 很 大 的 值 。 具体 的 算法 实现 
请 参考 calculatelloonShuoJD() 函数 。 入 参 td]D 是 近代 初始 值 , 这 个 初始 值 可 以 根据 朔望月 的 平均 
长 度 29.53059 进行 适当 的 估算 。 

double CalculateMoonShuoJD(double td]D) 


{ 


double JDO, JD1,stDegree, stDegreep; 


JD1 = td]D; 
do 
{ 

]D0 = JD1; 


double moonLongitude = GetMoonEclipticLongitudeEC(JDO); 
double sunLongitude = GetSunEclipticLongitudeEC(JDO); 
if((moonLongitude > 330.0) && (sunLongitude < 30.0)) 


sunLongitude = 360.0 + sunLongitude; 
} 
if((sunLongitude > 330.0) 8& (moonLongitude < 30.0)) 
{ 


moonLongitude = 60.0 + moonLongitude; 


} 
stDegree = moonLongitude - sunLongitude; 
stDegree = Mod360Degree(stDegree); 


stDegreep = (GetMoonEclipticlLongitudeEC (JDO + 0.000005) - GetSunEclipticLongitudeEC (JDO + 
0.000005) - GetMoonEclipticLongitudeEC (JDO - 0.000005) + GetSunEclipticLongitudeEC 
(JDO - 0.000005)) / 0.00001; 

JD1 = JDO - stDegree / stDegreep; 


}while((fabs(JD1 - JDO) > 0.00000001)); 


return JD1; 


. 

仿 验 一 下 我 们 的 算法 吧 ， 我 们 用 calculateMoonShuoJD() 函 数 计算 了 农历 2015 年 的 前 三 个 朔 
日 ， 分 别 是 : 

2015-02-19，07:47:17.38 春节 

2015-03-20，17:36:12.32 二 月 初 一 

2015-04-19，02:56:57.98 三 月 初 一 


大 家 可 以 和 2015 年 的 日 历 对 一 下 ， 看 看 准 不 准 。 


11.4 农历 的 生成 算法 
世界 各 国 的 日 历 都 是 以 天 为 最 小 单位 , 但 是 关于 年 和 月 的 算法 却 各 不 相同 , 大 致 可 以 分 为 以 


下 三 类 。 
口 阳历 ， 以 天 文 年 作为 日 历 的 主要 周期 ， 例 如 中 国 公 历 〈 格 里 历 )。 
口 阴历 ， 以 天 文 月 作为 日 历 的 主要 周期 ， 例 如 伊斯兰 历 。 


11.4 农历 的 生成 算法 号 153 


口 阴阳 历 ， 以 天 文 年 和 天 文 月 作为 日 历 的 主要 周期 ,例如 中 国 农历 。 

我 国 古人 很 早 就 开始 关注 天 象 ， 定 昼夜 交 蔡 为 “日 "， 月 轮 盘 亏 为 “月 "， 寒 暑 交 替 为 “年 "， 
在 总 结 日 月 变化 规律 的 基础 上 制定 了 兼 有 阴历 月 和 阳历 年 性 质 的 历法 , 称 为 中 国 农历 。 本 市 将 介 
绍 中 国 农历 的 历法 规则 、 天 干 地 支 的 计算 方法 、 二 十 四 节气 与 中 国 农历 的 关系 ， 以 及 在 知道 节气 
和 日 月 合 朔 的 精确 时 间 的 情况 下 推算 中 国 农历 年 历 的 方法 。 


11.4.1 中国 农历 的 起 源 与 历法 规则 


在 介绍 中 国 农历 的 历法 之 前 , 必须 要 先 介 绍 一 下 中 国 古 代 的 纪年 方法 。 中国 古代 用 天 干 地 支 
纪年 , 严格 来 讲 ， 天 干 地 支 纪年 以 及 十 二 属相 并 不 是 中 国 农历 历法 的 一 部 分 , 但 是 在 中 国 历史 上 
直到 今天 , 天 干 地 支 以 及 十 二 属相 一 直 都 是 中 国 农历 纪年 关系 密切 的 一 部 分 , 因此 这 里 先 介 绍 一 
下 天 干 地 支 纪年 法 以 及 十 二 属相 。 


1. 天 干 地 支 与 十 二 生肖 


中 国 古代 纪年 不 用 数字 ， 而 是 采用 天 干 地 支 组 合 。 | 分 别 是 : 甲 、 乙 、 两 、 丁 、 
戊 、 己 、 庚 、 辛 、 王 、 奖 ; 地 文 有 十 二 个 ,分别 是 : 子 、 丑 、 袖 、 卯 、 辰 、 已 、 午 、 未 、 申 、 酉 、 
成 、 辫 。 使 用 时 天 干 地 支 各 取 一 字 ， 天 干 在 前 ， 地 支 在 后 ， 2 例如 甲子 、 乙 丑 、 丙 实 
等 , 依次 轮回 可 形成 六 十 种 组 合 , 以 这 些 天 干 地 支 组 合 纪年 , 每 六 十 年 一 个 轮回 , 称 为 一 个 甲子 。 
实际 上 中 国 古 代 纪 月 、 纪 日 以 及 纪 时 展 都 采用 干支 方法 , 这 些 干 支 组 合 起 来 就 是 我 们 熟悉 的 生 展 
八字 。 


十 二 属相 又 称 “ 十 二 生肖 ”， 由 十 一 种 源 自 自然 界 的 动物 : 鼠 、 牛 、 虎 、 免 、 蛇 、 马 、 羊 、 
猴 、 鸡 、 狗 、 猪 以 及 传说 中 的 龙 组 成 ,用 于 纪年 时 , 按 顺 序 和 十 二 地 支 组 合成 子 鼠 、 丑 牛 、 寅 虎 、 
卯 免 、 辰 龙 、 已 蛇 、 午 马 、 未 羊 、 申 猴 、 丁 鸡 、 成 狗 和 净 猪 。 天 干 地 支 以 及 十 二 生肖 常 组 合 起 来 
描述 农历 年 ， 比 如 公历 2011 年 就 是 农历 辛 卯 免 年 ，2012 年 是 壬 展 龙 年 等 。 


计算 某 一 年 的 天 干 地 支 ， 有 很 多 经 验 公 式 ， 如 果 知 道 某 一 年 的 天 干 地 支 , 也 可 以 直接 推算 其 
他 年 份 的 天 干 地 支 。 举 个 例子 ， 如 果 知 道 2000 年 是 庚 辰 龙 年 ， 则 2012 年 的 干支 可 以 这 样 推算 : 
(2012 - 2000 ) % 10=2，2012 年 的 天 干 就 是 从 庚 开 始 向 后 推 2 个 天 干 ， 即 和 于。2012 年 的 地 支 可 以 
这 样 推算 : (2012 - 2000 ) % 12=0, 2012 年 的 地 支 仍 然 是 展 , 因此 2012 年 的 天 干 地 支 就 是 壬 展 ， 
十 二 生肖 龙 年 。 对 于 2000 年 以 前 的 年 份 ， 计 算出 年 份 差 后 只 要 将 天 干 和 地 支 向 前 推算 即 可 。 例 
如 1995 年 的 干支 可 以 这 样 计算 : (2000 - 1995 ) %10=5, (2000 - 1995 ) %12=5， 康 向 前 推算 5 
即 是 乙 ， 展 向 前 推算 5 即 是 效 ， 因 此 1995 年 的 干支 就 是 乙 雍 ， 十 二 生肖 猪 年 。 这 个 干支 推算 算 
法 的 实现 如 下 : 


void CalculateStemsBranches(int year, int *stems, int *branches) 
{ 

int sc = year - 2000; 

*stems = (7 + sc) % 10; 

*branches = (5 + sc) % 12; 
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if(*stems < 0) 
*cstems += 10; 

if(*branches < 0) 
*branches += 12; 


} 
定义 好 干支 和 十 二 生肖 的 名 称 数组 ， 就 可 以 实现 简单 的 干支 纪年 查询 功能 


六 


PE 


| | 
-OO 


" 交 ")，T(" 马 ")，T(" 羊 ")，T(" 独 "),T(" 鸡 ")，T(" 狗 ")，T(" 猪 ") 有 


int stems,branchs; 
CalculateStemsBranches(2008, &stems, &branchs); 


nameOfShengXiao[branchs - 1]); 
2008 年 是 农历 【 戊子 】 鼠 年 


2. 农历 半月 与 二 十 四 节气 的 关系 


HAR #nameOfShengXiao[CHINESE SHENGXIAO] = { T(" 鼠 ")，T(" 牛 ")，T(" 虎 ")，T(" 免 )，T(" 
( 


TCHAR *nameOfStems[HEAVENLY ， STENS] = ={ TGP TS"), TY TT TORK"), TOE), 


HAR *nameOfBranches[EARTHLY | BRANCHES] = {TC" 子 ")， TC" 于 ")，TC" 定 ")，T(" 儿 ")，T(" 搬 ")， 


龙 ")， 


text.Format(_T(" 农 历 【%s%s 】%s 年 "), m curMonth, nameOfStems[stems - 1], nameOfBranches[branchs - 


中 国 农历 是 以 月 亮 运行 周期 为 基础 ,结合 太阳 运行 规律 (二 十 四 节气 ) 制定 的 历法 ,农历 月 


的 定义 规则 就 是 中 国 农历 历法 的 关键 , 因此 要 了 解 中 国 农历 的 历法 规则 ,就 必须 知道 如 何 定义 月 ， 
如 何 设置 头 月 ? 中国 农历 的 一 年 有 十 二 个 月 或 十 三 个 月 , 但 是 正统 的 叫 法 只 有 十 二 个 月 , 分 别 是 


正月 、 二 月 、 三 月 、 四 月 、 五 月 、 六 月 、 七 月 、 八 月 、 九 月 、 十 月 、 冬 月 和 腊月 ( 注意， 


中 国 农历 是 没有 十 一 月 和 十 二 月 的 , 如 果 你 用 的 历法 软件 有 显示 农历 十 一 月 和 农历 十 二 月 
明 非 常 不 专业 )。 中国 民间 常用 “十 冬 腊月 天 ”来 形容 寒冷 的 天 气 ， 其 实 指 的 就 是 十 


正统 的 
， 就 说 
月 、 十 一 月 


和 十 二 月 这 三 个 最 冷 的 月 份 。 一 年 有 十 三 个 月 的 情况 是 因为 有 闻 月 ,多 出 来 的 这 个 间 


月 没有 


月 名 ， 


只 是 跟 在 某 个 月 后 面 ， 称 为 头 某 月 。 比 如 公历 2009 年 对 应 的 农历 乙 丑 年 ， 就 是 头 五 月 ， 于 是 这 


一 年 可 以 过 两 个 端午 节 。 


中 国 农历 为 什么 会 有 闵 月 ? 其 实 中 国 农历 置 闵 月 是 为 了 协调 回归 年 和 农历 年 的 矛盾 。 前 面 提 
到 过 ， 中 国 农历 是 一 种 阴阳 历 ， 农 历 的 月 分 大 月 和 小 月 ， 大 月 一 个 月 是 30 天 ， 小 月 一 个 月 是 29 


at 


“ 初 


天 。 中 国 农历 把 日 月 合 朔 ( 太阳 和 月 亮 的 黄 经 相同 , 但 是 月 亮 不 可 见 ) 的 日 期 定位 月 首 ，, 也 就 是 
”， 把 月 圆 的 时 候 定 为 望 日 ， 也 就 是 “十 五 >， 月 亮 绕 地 球 公转 一 周 称 为 一 个 朔望月 。 


天 文 


学 的 闭 望 月 长 度 是 29.5306 日 ， 中 国 农历 以 朔望月 为 基础 ， 严 格 保证 每 个 月 的 头 一 天 是 朔 日 ， 这 


就 使 得 每 个 月 是 大 月 还 是 小 月 的 安排 不 能 固定 , 通常 需要 通过 天 文学 观测 和 计算 来 确定 。 一 个 农 
历年 由 12 个 朔望月 组 成 ,这样 一 个 农历 年 的 长 度 就 是 29.5306 x 12= 354.3672 日 ,而 阳历 的 一 个 
天 文学 回归 年 是 365.2422 日 ， 这样 一 个 农历 年 就 比 一 个 回归 年 少 10.88 天 ， 这 个 误差 如 果 累 计 起 


来 过 16 年 就 会 


出 现 “六 月 飞 雪 ”的 奇观 了 。 为 了 协调 农历 年 和 回归 年 之 间 的 矛盾 ， 聪 明 的 先 人 


在 天 文 观测 的 基础 上 ,找到 了 “图 月 ”的 方法 , 通过 在 适当 的 月 份 插入 图 月 来 保证 每 个 农历 年 的 
正月 到 三 月 是 春季 ， 四 月 到 六 月 是 夏季 ， 七 月 到 九 月 是 秋季 ， 十 月 到 十 二 月 是 冬季 ， 也 就 是 说 ， 
让 历法 和 天 文 气象 能 够 基本 对 上 ， 不 至 于 出 现 “ 六 月 飞 雪 ”。 
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那么 多 长 时 间 增 加 一 个 国 月 比较 合适 呢 ?” 最 早 人 们 推算 是 “三 年 一 国 ”, 后 来 是 “五 年 两 头 ”， 
随 着 历法 计算 的 精确 ， 最 终 定型 为 “十 九 年 七 国 ”。 这 个 “十 九 年 七 国 ” 又 是 怎么 算出 来 的 呢 ? 
其 实 就 是 求 出 回归 年 日 数 和 朔望月 日 数 的 最 小 公 售 数 ,也 就 是 m 个 回归 年 的 天 数 和 个 朔望月 的 
天 数 相等 ， 即 : 


m x 365.2422 = n x 29.5306 
这 样 m 入 的 比例 就 是 29.5306 : 365.2422 二 9 : 235， 按 照 这 个 最 接近 的 整数 倍数 关系 ， 每 
19 个 回归 年 需要 添加 的 头 月 就 是 : 
235-12x19=7 
也 就 是 “十 九 年 七 头 ” 的 由 来 。 但 是 需要 注意 的 是 ,“ 十 九 年 七 状 ” 也 并 不 是 精确 的 结果 ,每 19 
年 就 会 有 0.0892 天 的 误差 : 


19 x 365.2422 - 235 x 29.5306 一 0.0892 

这 样 每 213 年 就 会 积累 约 1 天 的 误差 ， 因 此 ， 即 使 按照 “十 九 年 七 闽 ” 计 算 ， 中国 农 历 每 一 
两 百年 就 需要 修正 一 次 。 正 因为 这 样 ， 现 行 农历 从 唐 代 以 后 就 已 经 不 再 遵守 “十 九 年 七 间 ” 法 ， 
而 是 采用 更 准确 的 “中 气 置 羡 ” 法 。“ 中 气 置 头 ” 法 更 准确 的 名 称 应 该 是 “ 定 冬 至 ”法 ， 就 是 定 
两 个 冬至 节气 之 间 的 时 间 为 一 个 农历 年 , 这 样 农历 年 的 长 度 就 和 太阳 回归 年 长 度 对 应 , 不 会 产生 
误差 。 

现在 , 我 们 知道 农历 通过 置 头 月 的 方式 协调 农历 年 和 回归 年 长 度 不 相等 的 问题 , 也 知道 了 置 
状 的 方法 是 “中 和 气 置 靖 ” 法 ,那么 到 底 什么 是 “中 气 ”， 又 是 如 何 定 中 和 气 置 半月 呢 ? 要 回答 这 个 
问题 ， 就 需要 再 来 回顾 一 下 11.2.1 节 介 绍 的 一 种 天 文 现象 一 一 节气 。 由 于 节气 在 回归 年 中 是 均匀 
分 布 的 ， 因 此 公历 中 的 节气 日 期 基本 上 是 固定 的 ， 比 如 立春 是 在 公历 的 2 月 3 日 到 5 日 , 不 会 超 
出 这 个 日 期 范围 ， 这 也 就 是 《二 十 四 节气 歌 》 所 说 的 : 每 月 两 节 不 变更 ， 最 多 相差 一 两 天 。 但 是 
在 中 国 农历 中 哪个 中 气 属于 哪个 月 是 有 规定 的 ， 南 水 是 正月 的 中 气 , 春分 是 二 月 的 中 气 , 谷雨 是 
三 月 的 中 气 ， 小 满 是 四 月 的 中 气 ， 夏 至 是 五 月 的 中 气 ， 大 暑 是 六 月 的 中 气 ， 处 暑 是 七 月 的 中 气 ， 
秋分 是 八 月 的 中 气 , 霜降 是 九 月 的 中 气 , 小 月 是 十 月 的 中 气 , 冬至 是 十 一 月 的 中 气 ， 大 寒 是 十 二 
月 的 中 气 。 

传统 上 一 个 农历 年 起 于 冬至 节气 , 结束 于 冬至 节气 ， 因 此 要 确定 在 哪 一 年 置 闽 ， 主 要 看 那 一 
年 两 个 冬至 之 间 有 几 个 朔望月 。 如 果 两 个 冬至 节气 之 间 有 12 个 朔望月 ， 则 不 置 头 ， 如 果 有 十 三 
个 朔望月 ， 则 置 头 月 ， 至 于 头 几 月 ， 则 要 看 节气 而 定 。 对 于 有 13 个 朔望月 的 农历 年 ， 置 头 月 的 
规则 就 是 从 农历 二 月 开始 到 十 月 , 第 一 个 没有 中 和 气 的 月 就 是 头 月 , 这 个 没有 中 气 的 朔望月 跟 在 哪 
个 月 后 面 就 是 头 几 月 。 为 什么 会 有 没有 中 气 的 朔望月 呢 ? 黄道 上 两 个 中 气 之 间 相 隔 30 度 ， 一 个 
回归 年 的 长 度 是 365.2422 日 ， 则 两 个 中 气 之 间 的 平均 间隔 是 365.2422 > 12 = 30.4368 日 ， 但 是 因 
为 地 球 轨道 是 椭圆 轨 道 , 因此 相 邻 的 两 个 中 气 的 时 间 间 隔 是 不 均匀 的 ， 比 如 在 远地点 附近 的 中 气 
间隔 就 会 长 一 点 ， 最 长 可 能 是 31.45 天 。 而 农历 的 朔望月 平均 长 度 是 29.5306 日 ， 这 样 就 会 出 现 
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某 个 朔望月 刚好 落 在 两 个 中 气 之 间 的 情况 ， 比 如 ， 某 个 月 的 上 一 个 月 月 末 是 一 个 中 气 ,但 是 下 一 
个 中 气 落 在 这 个 月 的 下 一 个 月 的 头 几 天 里 ， 这 样 这 个 月 就 没有 中 气 了 。 举 个 例子 ，2001 年 农历 
革 已 年 的 四 月 二 十 九 〈 公 历 5 月 21 日 ) 是 小 满 ， 农 历 四 月 之 后 的 这 个 朔望月 从 公历 5 月 23 日 持 
续 到 公历 6 月 20 日 ， 而 小 满 后 的 下 一 个 中 气 夏 至 是 在 公历 的 6 月 21 日 ,也 就 是 农历 四 月 的 下 下 
个 月 的 初 一 ， 这 样 农历 四 月 后 的 这 个 月 就 没有 中 气 ， 跟 在 四 月 之 后 ， 就 称 为 国 四 月 。 

3. “月 建 ” 问 题 

在 了 解 了 农历 与 节气 的 关系 以 及 农历 如 何 置 头 月 的 方法 之 后 , 还 需要 解决 一 个 问题 才能 着 手 
农历 年 历 的 推算 , 那 就 是 如 何 确定 农历 年 的 开始 , 或 者 说 哪个 月 的 初 一 是 农历 新 年 的 开始 ? 要 回 
答 这 个 问题 ， 就 需要 了 解 中 国 农历 特有 的 “月 建 ”问题 。 


中 国 农历 是 阴阳 合 历 ， 需 要 同时 考虑 太阳 和 月 亮 的 位 置 。 所 以 在 确定 岁 首 (元旦 ) 时 , 需要 
先 确 定 它 在 某 个 季节 ， 然 后 再 选 定 与 这 个 季节 相近 的 朔望月 作为 岁 首 。 由 于 一 岁 (一 个 回归 年 ) 
和 12 个 阴历 月 并 不 相等 , 相差 约 10.88 天 , 因此 每 隔 三 年 需要 设置 一 个 头 月 调整 季节 。 中 国 上 十 
的 天 文学 家 想 出 了 一 个 简便 的 方法 判断 月 序 与 季节 的 关系 , 这 就 是 以 傍晚 时 北斗 七 星 的 斗 柄 的 指 
向 确定 月 序 ， 称 为 “十 二 月 建 "。 从 北方 起 向 东 转 ， 将 地 面 划分 为 十 二 个 方位 ， 傍 晚 时 北斗 所 指 
的 方位 ， 就 是 该 月 的 月 建 ， 其 子 月 为 冬至 所 在 之 月 ， 对 应 十 一 月 ， 丑 月 是 冬至 所 在 之 月 的 次 月 ， 
对 应 十 二 月 ， 寅 月 在 丑 月 之 后 ， 对 应 正月 。 中 国 在 历史 上 的 不 同时 期 ， 多 次 修改 过 岁 首 (元旦 ) 
的 起 始 月 份 ， 上 十 时 代 就 有 “三 正 ” 之 说 ， 所 谓 “ 三 正 ”， 就 是 “ 夏 正 建 寅 、 所 正 建 妖 、 周 正 建 
子 ”， 意 思 是 夏 历 以 袖 月 (正月 ) 为 岁 首 ， 筷 历 以 丑 月 (十 二 月 ) 为 岁 首 ， 周 历 以 子 月 (十 一 月 ) 
为 岁 首 。 从 秦 代 到 西汉 前 期 又 采用 秦 历 , 秦 历 建 玄 ,也 就 是 以 玄 月 作为 岁 首 之 月 ,， 汉 武帝 太初 元 
年 (公元 前 104 年 ) 改 用 太初 历 ， 重 新 适用 建 寅 的 夏 历 ， 以 袖 月 〈 正 月 ) 为 岁 首 。 在 这 之 后 的 两 
千 多 年 时 间 里 ， 除 王莽 和 魏 明 帝 一 度 改 用 建 丑 的 急 历 ， 唐 武后 和 肃 宗 时 改 用 建 子 的 周 历 外 ,各 个 
朝代 均 使 用 建 袖 的 夏 历 直 到 清朝 末年 。 辛亥 革命 胜利 以 后 ,南京 国民 政府 将 公历 1 月 1 日 改 为 元 
且 , 但 是 人 们 仍 习惯 称 农历 的 正月 初 一 为 元 旦 。 新 中 国 成 立 初期 召开 的 第 一 届 政 治 协商 会 议 , 正 
式 将 公历 的 1 月 1 日 确定 为 元 旦 ,将 农历 的 正月 初 一 定 为 “春节 ”， 也 就 是 说 ， 农 历 的 岁 首 仍 然 
采用 夏 历 从 寅 月 (正月 ) 开始 。 

4. 农历 基本 历法 规则 

了 解 了 “月 建 ” 问 题 ,， 就 解决 了 农历 朔望月 与 公历 月 的 对 应 关系 ， 那 就 是 冬至 节气 所 在 的 朔 
望月 就 是 农历 的 子 月 , 对 于 目前 适用 的 夏 历 建 寅 的 月 建 体 系 , 就 意味 着 冬至 节气 所 在 的 朔望月 是 
农历 的 十 一 月 ， 只 要 找到 这 个 朔望月 的 起 始 日 (日 月 合 朔 发 生 的 时 刻 所 在 的 那 一 日 )， 就 找到 了 
公历 的 日 期 月 农历 日 期 的 对 应 关系 。 下 面 总 结 一 下 中 国 农历 历法 的 基本 法 则 。 

(1) 严格 以 日 月 合 朔 发 生 时 刻 为 月 首 ， 这 一 天 定 为 初 一 ， 通 过 计算 两 次 日 月 合 朔 的 时 间 间 隔 
确定 每 月 是 29 天 还 是 30 天 ，29 天 的 月 份 为 小 月 ，30 天 的 月 份 为 大 月 ; 

(2) 月 以 中 气 得 名 ， 冬 至 节气 总 是 出 现在 农历 十 一 月 ， 包 含 雨 水 中 气 的 月 为 正月 〈 即 寅 月 )， 
月 无 中 气 者 为 国 月 ， 与 前 一 个 月 同名 ; 
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(3) 从 某 一 年 的 冬至 后 第 一 天 开始 ， 到 下 一 个 冬至 这 段 时 间 内 ， 如 果 有 十 三 个 朔望月 出 现 ， 
则 此 期 间 要 增加 一 个 状 月 ,从 二 月 到 十 月 ,第 一 个 没有 中 气 的 月 就 是 国 月 ， 如 果 在 此 期 间 有 超过 
两 个 朔望月 没有 中 气 ， 则 只 有 第 一 个 没有 中 和 气 的 朔望月 是 半月 ; 

(4) 农历 年 以 正月 初 一 为 岁 首 (关于 农历 岁 首 的 说 法 ， 可 参见 下 一 小 节 )， 以 腊月 〈 十 二 月 ) 
廿 九 或 三 十 为 除夕 ; 

(5) 如 果 节 气 和 日 月 合 朔 在 同一 天 ， 则 该 节气 是 这 个 新 朔望月 的 节气 。( 民间 历法 ) 

规则 (5) 对 节气 和 朔 日 在 同一 天 的 处 理 , 采用 了 民间 历法 的 处 理 原则 , 关于 民间 历法 和 历 理 历 
法 的 区 别 ， 我 们 马上 就 会 讲 到 。 

5. 农历 年 和 农历 生肖 年 〈 正 月初 一 和 立春 节气 ) 

立春 是 二 十 四 节气 之 首 ， 所 以 古代 民间 都 是 在 “立春 ”这 一 天 过 节 ， 相当 于 现代 的 春节 (中 
国 古代 即 是 节气 也 是 节日 的 情况 很 多 ， 比 如 清明 、 冬 至 等 )。1911 年 ， 孙 中 山 领导 的 辛 交 革命 建 
立 了 中 华 民国 ， 在 从 历法 上 正式 把 农历 正月 初 一 定 为 “春节 ”， 把 公历 1 月 1 日 定 为 “元 旦 ”, 也 
就 是 “新 年 "。 农 历年 从 正月 初 一 开始 没有 争议 , 但 是 农历 生肖 年 从 何 时 开始 却 一 直 有 和 争议, 目 
前 多 数 人 都 认为 “立春 ”节气 是 农历 生肖 年 的 开始 。 因 为 在 中 国 古代 历法 中 , 十 二 生肖 的 计算 与 
天 干 地 支 有 很 大 关系 ， 所 以 在 “ 论 天 干 地 支 、 计 算 廿 四 节气 ”的 情况 下 , “立春 ”节气 应 该 是 新 
生肖 的 开始 。 对 于 普通 老百姓 来 说 , 习惯 于 认为 正月 初 一 是 生肖 年 的 开始 , 因此 , 正月 初 一 和 “ 立 
春 ” 节 和 气 之 间 出 生 的 小 孩 ， 在 确定 属相 的 时 候 就 有 点 麻烦 了 。 属 马 还 是 属 羊 ? 这 是 个 问题 。 

6. 民间 历法 和 历 理 历法 

新 中 国 成 立 以 后 没有 颁布 新 的 “官方 农历 历法 ”， 将 历法 和 政治 分 离 体现 了 时 代 的 进步 ， 但 
是 由 于 没有 “官方 历法 ”， 也 引起 了 一 些 问 题 。 比 如 我 国 现在 采用 的 农历 历法 是 《时 完 历 》 它 
源 于 清朝 顺治 年 间 (公元 1645 ) 颁布 的 《顺治 历 》 它 有 两 个 不 足 之 处 : 一 个 是 日 月 合 逆 和 节气 
的 时 间 以 北京 当地 时 间 为 准 ， 也 就 是 东经 116 度 25 分 的 当地 时 间 ， 其 节气 和 新 月 的 观察 只 适用 
于 中 原 地 区 。 其 他 经 度 的 地 方 ， 因 为 时 间 的 关系 ， 对 导致 日 月 合 关 和 节气 时 间 的 差异 导致 置 关 和 
月 顺序 各 不 相同 。 另 一 个 不 足 之 处 就 是 日 月 合 朔 时 间 和 节气 时 间 判 断 不 精确 ,如果 日 月 合 朔 时 间 
和 节气 时 间 在 同一 天 , 不 管 具 体 的 时 间 是 和 否 有 先后 , 一 律 将 此 节气 算 作 新 月 中 的 节气 , 这 样 一 来 ， 
如 果 这 个 节气 是 中 气 , 就 会 影响 到 痿 月 的 设置 。 历 理 历法 针对 这 两 点 进行 了 改进 ,对 节气 时 间 和 
日 月 合 朔 时 间 统 一 采用 东经 120 度 即 东 八 区 标准 时 , 这 样 在 任何 时 区 的 节气 和 置 头 结果 都 是 一 样 
的 ， 以 东 八 区 标准 时 为 准 。 对 于 节气 时 间 和 日 月 合 朔 时 间 在 同一 天 的 情况 ， 精 确 计 算 到 时 、 分 、 
秒 , 只 有 日 月 合 朔 时 间 在 节气 时 间 之 前 , 这 个 节气 才 包 含 在 次 月 内 。 历 理 历法 从 理论 上 讲 更 符合 
现代 天 文学 的 精确 计算 , 但 是 需要 注意 的 是 , 历 理 历法 仍然 只 是 存在 于 理论 上 的 历法 ,我 国 现行 
的 农历 历法 依然 是 民间 历法 《时 完 历 》 或 《顺治 历 》 


11.4.2 ”中 国 农 历 的 推算 
了 解 了 农历 历法 的 基本 法 则 后 , 就 可 以 根据 历法 进行 农历 年 历 的 推算 。 农历 年历 的 推算 是 一 
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件 很 复杂 的 事情 , 需要 知道 每 年 二 十 四 个 节气 和 本 年 内 每 次 日 月 合 朔 的 精确 时 间 , 这 些 时 间 的 获 
取 比 较 困 难 。 现 在 有 很 多 可 以 显示 农历 的 日 历 软件 ,其 实 并 不 计算 这 些 时 间 ， 而 是 事先 从 权威 机 
构 ( 如 紫金 山 天文 台 ) 获取 这 些 经 过 推算 的 时 间 , 然后 用 各 种 方法 将 这 些 信息 存储 在 设计 好 的 数 
据 结构 中 。 当 计 算 农 历时 采用 查 表 的 方法 获取 每 年 的 二 二 四 节气 日 期 、 大 小 月 情况 以 及 闲 月 情况 ， 
这 样 的 软件 受 数据 量 的 限制 ， 往 往 只 能 显示 近 一 两 百年 的 年 历 。 

本 章 要 介绍 的 方法 是 建立 在 之 前 介绍 的 天 文 算法 的 基础 上 的 计算 方法 , 不 同 于 查 表 法 , 这 种 
方法 不 需要 任何 事先 预 设 的 数据 ， 可 以 计算 任何 年 份 的 历法 。 当 然 , 受 很 多 条 件 的 限制 ,这 种 方 
法 也 不 是 万 能 的 。 首 先 , 历史 上 已 经 确定 的 事件 , 仍然 要 以 历史 为 主 。 比 如 通过 现代 计算 发 现 古 
人 观测 存在 误差 ， 比 如 某 个 月 不 是 闽 月 , 或 者 某 个 节气 不 是 这 一 天 , 但 仍然 要 按照 历史 已 经 记载 
的 历法 使 用 。 其 次 , 我 们 目前 所 使 用 的 星 历 表 和 各 种 半 解 析 理 论 ， 都 只 能 在 近 两 三 千年 的 时 间 里 
将 误差 控制 在 一 定 范围 内 ， 更 远 的 时 间 上 ,肯定 需要 新 的 理论 进行 修正 或 替换 。 因 此 ， 万年历 是 
个 伪 命 题 ， 不 存在 一 统 万 年 的 万 年 历 ， 即 使 用 天 文 计 算 的 方法 ， 也 不 能 保证 万 年 以 后 的 准确 性 。 
地 球 自 转 的 速度 正在 变 慢 , 月 亮 正在 以 每 年 1 厘米 的 速度 远离 地 球 , 这些 非 周 期 性 变化 的 因素 都 
会 导致 万 年 以 后 的 计算 毫 无 意义 。 

忘掉 万 年 历 吧 , 本 章 的 重点 是 介绍 如 何 推算 农历 历法 , 即便 使 用 的 是 先进 理论 指导 下 的 天 文 
算法 ， 也 不 能 保证 任意 时 刻 都 是 有 意义 的 。 

1. 利用 经 验 值 推算 农历 

在 各 种 天 文 算法 的 理论 出 现 之 前 ， 人们 一 般 采 用 一 些 经 验 公式 近似 的 计算 农历 。 有 一 些 经 验 
公式 可 以 用 来 计算 节气 发 生 的 日 期 , 也 一 些 经 验 公式 用 来 计算 朔 日 。 通 式 寿 星 公 式 是 前 人 整理 出 
来 的 一 个 用 于 计算 每 年 立春 日 期 的 经 验 公 式 , 可 以 计算 出 某 一 年 的 某 个 节气 时 间 , 但 是 只 能 精确 
到 日 。 其 定义 如 下 : 


Date=| YrxD+C|-L 


其 中 , 了 是 年 份 , DD 的 值 是 0.2422，C 是 经 验 值 ， 取 决 于 节气 和 年 份 ， 对 于 21 世纪 ,立春 节气 的 
C 值 是 4.475， 春 分 节气 的 C 值 是 20.646。 工 是 半年 数 ， 其 计算 公式 为 ; 


工 = [7 了 /4| -|Y/100|+|Y/400| 
用 通 式 寿星 公式 确定 2011 年 立春 日 期 的 过 程 如 下 : 
工 =int(2011/4) — int(2011/100) + int(2011/400) = 502-20 + 5 = 487 


Date = int ( 2011x0.2422+4.475 ) — 487 = 491 - 487=4 
所 以 ，2011 年 的 立春 日 期 是 2 月 4 日 。 
历史 上 还 有 人 给 出 了 计算 节气 和 朔 日 的 积 日 公式 , 以 1900 年 1 月 0 日 (星期 日 ) 为 基准 日 ， 
之 后 的 每 一 天 与 基准 日 的 差 值 称 为 积 日 ，1900 年 1 月 1 日 的 积 日 是 1, 以 后 的 时 间 以 此 类 推 。 则 
计算 1900 年 之 后 第 y 年 第 x 个 节气 的 积 日 公式 是 : 
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F=365.242 * (y -1900) + 6.2+ 15.22 *x— 1.9* sin(0.262 * x) 
其 中 x 是 节气 的 索引 ,0 代表 小 寒 ，1 代表 大 寒 ， 其 他 节气 按照 顺序 类 推 。 计 算 从 1900 年 开始 第 
m 个 朔 日 的 公式 是 : 


M=1.6+29.5306 * m+0.4* sin(l — 0.45058 * m) 

以 上 两 个 公式 计算 的 结果 是 从 1900 年 1 月 0 日 开始 的 积 日 ， 需 要 根据 这 些 年 的 头 年 情况 转 
化 为 具体 年 份 的 具体 日 期 。 毫 无 疑问 ， 这 两 个 公式 也 只 能 精确 到 日 ， 并 且 随 着 时 间距 离 1900 年 
越 远 ， 误 差 越 大 ， 时 至 今日 已 经 很 少 使 用 了 。 

还 有 一 种 确定 节气 时 间 和 朔 日 时 间 的 方法 ,就 是 在 已 知 某 个 节气 或 朔 日 的 精确 时 间 后 , 通过 
某 些 规律 先前 或 身后 推算 其 他 节气 或 朔 日 的 时 间 。 二 十 四 个 节气 就 是 黄道 上 的 24 个 点 ， 由 于 地 
球 运动 受 其 他 天 体 的 影响 , 导致 这 些 节 气 在 每 年 的 时 间 是 不 固定 的 , 但 是 这 些 节气 之 间 的 间隔 时 
间 基 本 上 可 以 看 作 是 固定 的 ， 表 11-1 就 是 二 十 四 节气 的 时 间 间 隔 表 。 


表 11-1 二 十 四 节气 时 间 间 隔 表 〈 单 位 : 秒 钟 ) 


节气 与 上 一 节气 之 间 的 上 时间差 与 小 寒 节 气 的 累积 时 间 差 
小 塞 1271448.00 0.00 
大 寒 1272494.40 1272494.40 
立春 1275526.20 2548020.60 
雨水 1282123.20 3830143.80 
惊 执 1290082.80 5120226.60 
春分 1300639.20 6420865.80 
清明 1311153.00 7732018.80 
谷雨 1323253.80 9055272.60 
立夏 1333685.40 10388958.00 
小 满 1344107.40 11733065.40 
芒种 1351227.00 13084292.40 
夏至 1357299.60 14441592.00 
小 里 1358968.80 15800560.80 
大 时 1358786.40 17159347.20 
立秋 1354419.00 18513766.20 
处 里 1348236.00 19862002.20 
白露 1339003.20 21201005.40 
秋分 1328654.40 22529659.80 
寒露 1317185.40 23846845.20 
霜降 1305760.80 25152606.00 
立冬 1295081.40 26447687.40 
小 雪 1285764.00 27733451.40 
大 雪 1278469.80 29011921.20 
冬至 1273556.40 30285477.60 
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已 知 1900 年 小 寒 时 刻 为 1 月 6 日 2:05:00， 以 这 个 节气 时 刻 为 基准 ， 推 算 其 他 年 份 节气 的 算 
法 实现 如 下 : 
static double s stAccInfo[] = 
{ 
0.00，1272494.40，2548020.60，3830143.80，5120226.60，6420865.80,7732018.80，9055272.60， 

10388958.00，11733065.40，13084292.40，14441592.00,15800560.80，17159347.20，18513766.20，19862002.20， 
21201005.40, 22529659.80, 23846845.20, 25152606.00, 26447687.40, 27733451.40, 29011921.20, 30285477.60 
}; 


// 已 知 1900 年 小 寒 时 刻 为 1 月 6 日 02:05:00， 
const double base1900 SlightColdJD = 2415025.5868055555; 
double CalculateSolarTermsByExp(int year, int st) 
jit(Cst. XO | | “(sty24)y 
return 0.0; 
double stjd = 365.24219878 * (year - 1900) + s_stAccInfo[st] / 86400.0; 


return base1900 SlightColdJD + stjJd; 
} 


base1900_SlightColdJD 是 北京 时 间 1900 年 1 月 6 日 凌晨 2:05:00 的 儒 略 日 数 ，CalculateSolar 
TermsByExp() 函 数 返回 指定 年 份 的 节气 的 儒 略 日 数 。 已 知 某 个 朔 日 的 精确 时 间 推 算 其 他 朔 日 时 间 
的 方法 也 类 似 ， 以 朔望月 的 长 度 为 单位 向 前 或 向 后 累加 即 可 。 

这 种 推算 的 方法 是 建立 在 地 球 回归 年 的 长 度 是 固定 365.2422 天 、 节 气 的 间隔 是 绝对 固定 的 、 
朔望月 长 度 是 平均 的 29.5305 天 等 假设 之 上 的 ， 由 于 天 体 运动 的 互相 影响 ,这 种 假设 不 是 绝对 成 立 
的 ， 因 此 这 种 推算 方法 的 误差 很 大 。 以 CalculateSolarTermsByExp() 函 数 为 例 ， 计 算 1900 年 前 后 30 
年 内 的 节气 时 间 的 误差 还 可 以 控制 在 30 分钟 以 内 ,但 是 到 2000 年 的 时 候 误 差 已 经 超过 130 分 钟 了 。 

2. 根据 天 文 算 法 精确 推算 农历 

要 想 精 确 地 获得 几 百 年 力 至 更 长 时 间 范 围 内 任意 一 年 的 节气 发 生 时 间 和 日 月 合 朔 时 间 , 就 只 
能 采用 “天 文 算 法 ”。 本 章 介绍 了 VSOP82/87 太阳 系 行星 运行 理论 和 ELP-2000/82 月 球 运行 理论 ， 
这 是 两 种 半 解 析 理 论 , 也 是 本 章 所 给 出 的 算法 的 基础 。 如 果 要 求 更 高 的 精度 ,可 以 考虑 使 用 各 天 
文 台 或 研究 机 构 发 布 的 有 针对 性 的 星 历 表 。 比较 著名 的 星 历 表 有 美国 国家 航空 航天 局 下 属 的 喷气 
推进 实验 室 发 布 的 DE 系列 星 历 表 , 还 有 瑞士 天 文 台 在 DE406 基础 上 拓展 的 瑞士 星 历 表 等 。 根据 
行星 运行 轨道 直接 计算 行星 位 置 通常 不 是 很 方便 , 更 何况 大 多 数 民用 天 文 计算 用 不 上 那么 多 精确 
的 轨道 参数 ， 所 以 使 用 本 章 介 绍 的 两 个 理论 对 于 日 历 的 推算 已 经 够 用 了 。 

3. 农历 与 公历 的 对 应 关系 

中 国 的 官方 纪 时 采用 的 是 中 国 公历 ( 格 里 历 )， 因 此 农历 年 历 的 推导 应 以 公历 年 的 周期 为 主 
导 ， 附 上 农历 年 的 信息 ， 也 就 是 说 ， 年 历 以 公历 的 1 月 工 日 为 起 始 , 至 12 月 31 日 结束 ， 根 据 农 
历历 法 推导 出 的 农历 日 期 信息 ， 附 加 在 公历 日 期 信息 上 形成 双 历 。 通 常情 况 下 ,一 个 公历 年 周期 
都 不 能 完整 地 对 应 到 一 个 农历 年 周期 上 , 二 者 的 偏差 也 不 固定 ， 因 此 不 存在 稳定 的 对 应 关系 ,也 
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就 是 说 , 不 存在 从 公历 的 日 期 到 农历 日 期 的 转换 公式 ， 只 能 根据 农历 的 历法 规则 推导 出 农历 日 期 
与 公历 日 期 的 对 应 关系 。 由 农历 历法 规则 可 知 ， 上 一 个 公历 年 的 冬至 所 在 的 朔望月 是 上 一 个 农历 
年 的 十 一 月 ( 冬 月 )， 所 以 在 进行 节气 计算 时 ， 需 要 计算 包括 上 一 年 冬至 节气 在 内 的 二 十 五 个 节 
气 , 才能 对 应 上 上 一 个 农历 年 的 十 一 月 和 当前 农历 年 的 十 一 月 。 在 计算 与 之 对 应 的 朔 日 时 , 考虑 
到 有 逆 月 的 情况 ， 需 要 从 上 一 年 冬至 节气 前 的 第 一 个 朔 日 ， 连 续 计算 15 个 朔 日 才能 保证 覆盖 两 
个 冬至 之 间 的 一 整 年 时 间 ， 图 11-4 显示 了 2011 年 没有 半月 的 情况 下 朔 日 和 冬至 的 关系 。 

图 11-4 中 上 排 数 字 是 公历 月 的 编号 , 黑色 圆 点 代表 朔 日 , 黑色 三 角形 代表 冬至 节气 。 图 11-5 
显示 了 2012 年 有 闽 月 的 情况 下 朔 日 和 冬至 的 关系 。 


2010 | 2011 Wi 
12 1 2 3 4 S 6 7 8 9 10 11 2 1 
|. 多 . [: S 上 |。 | | | | . | . 

RD 3 4 S 6 7 8 9 10 11 12 13 @14 15 
。 朔 日 
A 冬至 


第 一 个 冬至 节气 是 2010 年 12 月 22 日 ， 在 它 之 前 最 近 的 一 个 朔 日 是 2010 年 12 月 6 日 
第 二 个 冬至 节气 是 2011 年 12 月 22 日 ， 在 它 之 后 最 近 的 一 个 朔 日 是 2011 年 12 月 25 日 


图 11-4 没有 闽 月 情况 下 朔 日 与 冬至 节气 关系 图 


2011 | 2012 | 
12 2 过 4 S 6 7 8 9 10 11 12 1 
ly Faller le sls hl 

1 9 3 4 5 6 7 8 9 10 11 12 13 14@ 15 

e 关 日 

全 冬至 

第 一 个 冬至 节气 是 2011 年 12 月 2 日 ， 在 它 之 后 最 近 的 一 个 朔 日 是 2011 年 12 月 25 日 
第 二 个 冬至 节气 是 2012 年 12 月 21 日 ， 在 它 之 后 最 近 的 一 个 朔 日 是 2013 年 1 月 12 日 


两 个 冬至 之 问 有 13 个 朔 口 ，2012 什 需要 韶 月 

图 11-5 有 半月 情况 下 朔 日 与 冬至 节气 关系 图 

通过 计算 得 到 能 够 覆盖 两 个 冬至 节气 的 所 有 朔 日 时 间 后 , 就 可 以 着 手 建立 公历 日 期 与 农历 日 
期 的 对 应 关系 。 以 图 11-4 所 示 的 2011 年 为 例 ， 首 先 根据 计算 得 到 的 15 个 朔 日 (2011 年 只 会 用 
到 其 中 的 前 14 个 时 间 ) 时 间 ， 建 立 与 2011 年 (公历 年 ) 有 关 的 朔望月 关系 表 ( 如 表 11-2 所 示 )。 


表 11-2 ”2011 年 朔望月 与 公历 日 期 关系 表 


朔 日 编号 合 闻 时间 对 应 公历 日 期 月 长 月 名 
1 01:35:39.90 2010-12-06 29 冬 月 
2 17:02:34.26 2011-01-04 30 腊月 
3 10:30:42.67 2011-02-03 30 正月 
4 04:45:59.44 2011-03-05 29 二 月 
5 22:32:15.13 2011-04-03 30 | 
6 14:50:31.79 2011-05-03 30 四 月 
4 05:02:32.51 2011-06-02 29 五 月 
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( 续 ) 
朔 日 编号 合 关 时 间 对 应 公历 日 期 月 长 月 名 
8 16:53:54.10 2011-07-01 30 六 月 
9 02:39:45.06 2011-07-31 29 七 月 
10 11:04:06.43 2011-08-29 29 八 月 
11 19:08:50.09 2011-09-27 30 九 月 
12 03:55:54.64 2011-10-27 29 十 月 
13 14:09:40.97 2011-11-25 30 冬 月 
14 02:06:27.05 2011-12-25 29 腊月 
15 15:39:23.99 2012-01-23 30 正月 


两 个 朔望月 之 间 有 多 少 天 ， 这 个 农历 月 


(十 一 月 ), 因为 冬至 节气 落 在 这 个 朔望月 ， 其 他 月 的 
公历 和 农历 双 历 时 , 以 月 (公历 ) 为 单位 , 从 每 


就 有 多 少 天 ，29 天 是 小 
某 月 小 或 某 月 大 的 月 名 。 在 图 11-4 和 图 11-5 中 ， 编 号 为 1 和 2 的 两 个 朔 日 之 间 的 朔望月 是 冬 月 


月 名 以 此 类 推 ， 


月 ，30 天 是 大 月 ， 分 别 冠 以 


正月 的 朔 日 就 是 春节 。 输出 


第 一 天 开始 , 依次 判断 每 一 天 属于 哪个 朔望月 ， 


确定 这 一 天 的 农历 月 名 , 然后 比较 这 一 天 和 这 个 朔望月 的 朔 日 之 间 相 差 儿 天 , 记 为 农历 日 期 。 以 


2011 年 1 月 1 日 为 例 ， 这 一 天 在 2010 年 12 


月 6 日 (2010 年 农历 冬 
日 之 间 (2010 年 农历 腊月 的 朔 日 )， 查 表 11-2 可 知 对 应 的 农历 


月 的 朔 日 ) 和 2011 年 1 月 4 


月 冬 月 ， 这 一 天 和 2010 年 12 月 6 


日 相差 26 天 ， 因 此 这 一 天 的 农历 日 期 就 是 “ 甘 七 ”。 再 以 2011 年 2 月 3 日 (春节 ) 这 一 天 为 例 ， 


查 表 11-2 得 知 2 月 3 日 属于 从 2 月 3 日 开始 的 朔 望 


是 月 首 ， 农 历 日 期 是 初 一 ， 正 月 初 一 就 是 春 


双 历 年 历 的 算法 流程 如 图 11-6 所 示 。 


节 。 


GetAllSolarTermsJD() 哨 数 从 指定 年 份 的 指定 节气 
跨 年 份 ， 内 部 判断 过 冬至 节气 后 自动 转 到 下 一 年 的 节气 继续 计算 : 


void CChineseCalendar::GetAllSolarTermsJD(int year, int start, double *SolarTerms) 


{ 
int i = 0; 
int st = start; 
while(i < 25) 
{ 


月 ,这 个 朔望月 的 月 名 是 正月 , 而 2 月 3 日 就 


在 11.2 节 和 11.3 闻 我 们 分 别 介绍 了 计算 节气 的 calculateSolarTerms() 也 数 和 计算 日 月 合 朔 时 
间 的 CalculateMoonShuoJD() 函 数 ， 现 在 就 是 用 它们 的 时 候 了 。 生 成 指定 公历 年 份 的 公历 和 农历 的 


SolarTerms[i++] = CalculateSolarTerms(year, st * 15); 


if(st == WINTER SOLSTICE) 


{ 
yeaI++j 
} 
st = (st + 1) % SOLAR TERMS COUNT; 


开始 ， 连 续 计 算 25 个 节气 时 间 ， 时 间 可 以 


指定 公历 年 从 
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从 前 一 年 冬至 前 开始 
i 日 


的 月 ,二 
信息 表 


查找 第 一 个 没有 
调整 逆 
的 月 


| 


中 
望 
名 


和 
月 


| 


ee 日 生成 1 
续 朔 望月 的 信息 


4 
表 


| 


人 
Sw 气 之 间 有 几 
个 朔望月 


根据 朔 


图 11-6 计算 公 农 历 双 历 年 历 的 算法 流程 


start 参数 是 
int VERNAL EQUI 
int CLEAR AND B 
int GRAIN RAIN 
int SUMMER BEGI 
int GRAIN BUDS 
int GRAIN IN EA 
int SUMMER SOLS 
int SLIGHT_HEAT 
int GREAT_ HEAT 
int AUTUMN BEGI 
int STOPPING TH 
t int WHITE DEWS 
t int AUTUMN EQUI 
int COLD DEWS 
int HOAR FROST 
int WINTER BEGI 
t int LIGHT SNOW 
int HEAVY SNOW 
int WINTER SOLS 
int SLIGHT COLD 
t int GREAT COLD 


节气 的 索引 ， 


NOX = 
RIGHT = 


NS = 
R = 
TICE = 
NS E 
E HEAT = 


NOX = 


FALLS = 


TICE = 


定义 二 十 四 节气 的 索引 如 下 : 
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const int SPRING BEGINS 
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const int THE RAINS 


const int INSECTS AWAKEN 
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= 21;  // 立春 
= 22;  // 雨水 
= 23;  // 惊 执 


节气 索引 乘 以 15 就 是 节气 在 黄道 上 对 应 的 度数 。GetNewMoonJDs() 函 数 从 指定 时 间 开 始 连 续 
计算 15 个 朔 日 时 间 , 从 第 一 个 冬至 节气 前 的 第 一 个 朔 日 开始 。15 个 朔 日 可 以 形成 14 个 完整 的 逆 


望月 , 保证 在 有 图 


void CChineseCa 


月 的 情况 下 也 能 包含 两 个 冬至 节气 : 


endar: :GetNewMoonJDs (double jd, double *NewMoon) 


double tdjd = JDLocalTimetoTD(jd); 


for(int i = 0; i < NEW MOON CALC COUNT; i++) 


{ 


NewMoon[i] = CalculateMoonShuoJD(tdjd); 


tdjd += 29.5; /* 转 到 下 一 个 最 接近 朔 日 的 时 间 ， 和 牛顿 迭代 法 的 初始 值 */ 


} 
} 


BuildAllChnwonthInfo() 函 数 根据 15 个 朔 日 时 间 组 成 14 个 朔望月 ， 根 据 相 邻 朔 日 的 间隔 计算 
出 农历 月 天 数 用 来 判定 大 小 月 ， 并 且 从 “十 一 月 ”开始 依次 为 每 个 朔望月 命名 ( 月 建 名 称 ): 


bool CChineseCalendar::BuildAllChnMonthInfo() 


{ 


CHN_MONTH_INFO info; // 一 年 最 多 可 个 农历 月 


Tt 


int yuejian = 11;  // 采 用 夏 历 建 寅 ， 冬 至 所 在 月 份 为 农历 月 
for(i = 0; i «< (NEW MOON CALC COUNT - 1); i++) 


{ 


info 


info. 
info. 
info. 
info. 
.mdays = int(info.nextJD + 0.5) - int(info.shuoJD + 0.5); 
info. 


mmonth 


Ea 


mname = (yuejian <= 12) ? yuejian : yuejian - 12; 


shuoJD 
nextJD 


leap = 


m NewMoonJD[i]; 
m NewMoonJD[i + 1]; 


0; 


CChnMonthInfo cm(&info); 
m ChnMonthInfo.push back(cm); 


yuejiant+tt+; 


} 


return (m ChnMonthInfo.size() == (NEW MOON CALC COUNT - 1)); 


} 


CalcLeapChnMonth() 函 数 根据 广 气 和 朔 日 时 间 判 断 在 两 个 冬至 节气 之 间 的 农历 年 是 否 有 羡 月 ， 


判断 的 依据 就 是 


A 
全 
2 


四 个 朔 日 是 否 在 第 二 个 冬至 节气 之 前 , 如 果 第 十 四 个 朔 日 发 生 在 第 二 个 冬 


至 节气 之 前 ， 就 说 明 在 两 个 冬至 节气 之 间 发 生 了 十 三 次 朔 日 ,需要 置 头 月 。 因 为 农历 中 十 二 个 中 


气 属于 哪个 农历 月 是 固定 的 ， 因 此 置 头 月 的 过 程 就 是 依次 判断 十 二 个 中 气 是 否 在 对 应 的 农历 月 
中 ,如 果 本 应 该 属于 某 个 农历 月 的 中 气 却 没有 落 在 这 个 农历 月 中 , 则 这 个 农历 月 就 是 头 月 ， 需 要 
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设置 疼 月 标志 ,同时 调整 这 个 月 之 后 的 月 名 。 调整 农 历 月 名 的 方法 就 是 月 名 减 一 ， 比 如 原来 是 八 
月 就 要 调整 为 七 月 , 这 样 就 将 十 三 个 月 对 应 上 了 十 二 个 月 名 (其 中 多 出 来 的 一 个 农历 月 命名 为 闽 
某 月 )。 如 果 节 气 和 朔 日 发 生 在 同一 天 ，CcalcLeapChnMonth() 函 数 采 用 的 是 民间 历法 的 规则 ， 与 现 
行 历法 一 致 : 

/# 根 据 节气 计算 是 否 有 头 月 ， 如 果 有 头 月 ， 根 据 农 历 月 命名 规则 ， 调 整 月 名 称 #/ 

void CChineseCalendar: :CalcLeapChnMonth() 


{ 


assert(m ChnMonthInfo.size() > 0); /* 阴 历 月 的 初始 化 必须 在 这 个 之 前 */ 


int i; 
// 第 月 的 月 末 没 有 超过 冬至 ， 说 明 今年 需要 头 一 个 月 
if(int(m NewMoonJD[13] + 0.5) <= int(m SolarTermsJD[24] + 0.5)) 
{ 
// 找 到 第 一 个 没有 中 气 的 月 
rs 
while(i < (NEW MOON CALC COUNT - 1)) 
{ 
Fd 
m_ NewMoonJD[i + 1] 是 第 个 农历 月 的 下 一 个 月 的 月 首 ， 本 该 属于 第 i 个 月 的 
中 气 如 果 比 下 一 个 月 的 月 首 还 晚 ， 或 者 与 下 个 月 的 月 首 是 同一 天 (民间 历法 )， 
则 说 明 第 i 个 月 没有 中 气 
*/ 
if(int(m NewMoonJD[i + 1] + 0.5) <= int(m SolarTermsJD[2 * i] + 0.5)) 
break; 
++; 


} 

/# 找 到 半月 ， 对 后 面 的 农历 月 调整 月 名 #/ 

if(i < (NEW MOON CALC COUNT - 1)) 

{ 
m ChnMonthInfo[i].SetLeapMonth(true); 
while(i < (NEW MOON CALC COUNT - 1)) 


m ChnMonthInfo[i++].ReIndexMonthName(); 
} 
} 
和 
} 


11.4.3 ”一 个 简单 的 “年 历 ” 


到 现在 为 止 , 我 们 已 经 计算 出 了 一 年 之 内 所 有 的 朔 日 和 节气 时 间 , 也 按照 农历 的 规则 准备 好 
了 农历 月 的 信息 (包括 羡 月 ) 和 与 公历 的 对 应 关系 ,结合 之 前 的 天 干 地 支 和 生肖 信息 ,我 们 已 经 
具备 了 一 个 日 历 所 必需 的 全 部 元 素 , 剩 下 的 工作 就 是 显示 出 这 些 信息 , 像 日 历 一 样 展示 给 人 们 使 
用 。 我 做 了 一 个 显示 日 历 的 小 控件 ， 将 我 们 的 成 果 展 示 出 来 ， 如 图 11-7 所 示 ， 这 就 是 我 们 本 章 
的 算法 体现 出 的 结果 。 
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虎 应 用 天 文 算法 计算 农历 x| 


星期 日 星期 一 星期 二 “星期 三 ， 星 期 四 “星期 五 ， 星 期 六 
3 5 


初 五 ” 初 六 初 七 初 八 初 九 


5 本 0 === 
人 


130 T1499 15 160 7 18019 
a ls = 


20 21U2223 24925320 
王 机 三 


图 11-7 演示 程序 的 界面 


再 遇 到 所 谓 的 “万 年 历 ” 软 件 的 时 候 ， 你 也 不 用 感觉 太 神 奇 了 ， 对 于 查 表 方式 的 软件 ， 你 可 
以 赣 视 它们 了 。 


11.5 总结 


许多 中 国人 有 一 种 与 生 俱 来 的 感觉 , 就 是 农历 比 公 历 准 , 实际 上 这 种 比较 是 没有 意义 的 。 年 、 
月 、 日 都 是 人 类 定义 的 记录 单位 ,宇宙 中 的 天 体 有 自己 的 运行 规律 ， 才 不 管 人 类 的 感受 。 人 类 拿 
着 自己 定义 好 的 年 、 月 、 日 往 上 套 ， 自 然 会 出 现 误 差 ， 各 种 “ 头 ” 就 是 这 么 来 的 。 农 历 采用 “ 定 
冬至 法 ”确定 一 年 的 区 间 , 很 好 地 解决 了 四 季 的 气候 变化 与 人 类 的 主观 感受 之 间 的 关系 , 与 之 对 
应 的 公历 的 月 实际 上 就 没有 太 大 的 意义 , 划分 四 季 也 有 点 牵强 。 但 是 不 能 根据 这 一 点 就 说 农历 比 
公历 准确 。 确 切 地 说 ,农历 和 公历 都 不 准 ， 除 非 人 类 放弃 年 、 月 、 日 这 种 计时 方式 , 不 管 氏 天 黑 
地 和 四 季 变 化 , 统一 采用 一 个 标准 计时 单位 记录 时 间 。 情侣 们 会 这 样 微 信 他 们 的 伴侣 :“ 亲 爱 的 ， 
我 在 电影 院 门口 等 你 ， 时 间 是 第 10029384848737375 标准 时 间 单 位 ， 不 见 不 散 !” 至 于 第 
10029384848737375 标准 时 间 单 位 是 冬天 还 是 夏天 ， 是 白天 还 是 晚上 ， 佑 值 也 不 会 有 人 关注 这 个 
事情 了 ， 你 愿意 过 这 样 的 生活 吗 ? 

回 到 原来 的 话题 ， 怎么 记 生 日 才 准 确 ， 是 农历 ,还 是 公历 ?都 不 是 ! 你 应 该 计算 出 你 出 生 的 
那个 时 刻 地 球 的 日 心 黄 经 ， 记 住 这 个 位 置 ， 以 后 每 当地 球 运行 到 这 个 位 置 时 就 庆祝 你 的 生日 吧 。 
等 等 , 我 忘 了 什么 事情 了 吗 ? 对 了 ， 地球 的 自转 ,除了 地 球 的 日 心 黄 经 ,还 要 计算 地 球 自转 偏转 
过 的 角度 , 流 汗 了 吧 ? 计算 其 实 不 难 , 难 的 是 地 球 公转 多 少 个 周期 才能 刚好 碰 上 这 个 偏 角 ?你 看 ， 
过 个 准确 的 生日 这 么 难 ， 这 个 生日 你 到 底 是 过 还 是 不 过 啊 ? 

算法 在 生活 中 无 处 不 在 ， 有 了 各 种 行星 运行 理论 ， 相关 的 天 文 计算 的 算法 也 简化 了 ， 非 天 文 
物理 专业 的 历法 爱好 者 也 可 以 进行 简单 的 历法 计算 , 确定 一 些 天 文 现象 的 时 间 。 蔡 勒 公 式 让 那些 
给 个 日 期 就 能 说 出 是 星期 几 的 神 人 不 再 神奇 。 当 然 , 还 有 我 们 熟悉 的 牛顿 迭代 法 ,在 计算 二 十 四 
节气 和 朔 日 的 时 候 两 次 用 到 了 它 。 
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第 / 攻 章 
买 验 数据 与 曲线 拟 合 


在 科学 研究 和 工程 实践 过 程 中 , 都 有 大 量 的 数据 需要 分 析 和 处 理 。 对 这 些 数据 进行 图 形 化 的 
展示 ， 相 对 于 一 堆 离 散 的 数据 来 说 , 能 更 直观 地 看 出 数据 的 实际 意义 和 变化 趋势 。 将 数据 转换 成 
图 形 展示 有 很 多 种 方法 ,曲线 拟 合 就 是 二 维 图 形 化 展示 的 一 种 ,本 童 就 介绍 两 种 最 常见 的 曲线 拟 
合算 法 。 


12.1 曲线 拟 合 


科学 和 工程 上 遇 到 的 很 多 问题 ， 往 往 只 能 通过 诸如 采样 、 实 验 等 方法 获得 若干 离散 的 数据 ， 
根据 这 些 数 据 ， 如 果 能 够 找到 一 个 连续 的 函数 ( 也 就 是 曲线 ) 或 者 更 加 密集 的 离散 方程 ,使 得 实 
验 数据 与 方程 的 曲线 能 够 在 最 大 程度 上 近似 吻合 , 就 可 以 根据 曲线 方程 对 数据 进行 数学 计算 , 对 
实验 结果 进行 理论 分 析 ， 其 至 对 某 些 不 具备 测量 条 件 的 位 置 的 结果 进行 估算 。 


12.1.1 曲线 拟 合 的 定义 


曲线 拟 合 (curve fitting ) 的 数学 定义 是 指 用 连续 曲线 近似 地 刻画 或 比拟 平面 上 一 组 离散 点 所 
表示 的 坐标 之 间 的 函数 关系 ,是 一 种 用 解析 表达 式 允 近 离散 数据 的 方法 。 曲 线 拟 合 通俗 的 说 法 就 
是 “ 拉 曲 线 ”"， 也 就 是 将 现 有 数据 透 过 数学 方法 来 代入 一 条 数学 方程 式 的 表示 方法 。 由 以 上 定义 
可 知 , 曲线 拟 合 不 仅仅 是 根据 离散 数据 画 出 一 条 曲线 ,曲线 拟 合 更 重要 的 意义 是 通过 特定 的 曲线 
拟 合 算法 ， 推 算出 一 个 (或 一 系列 ) 能 逼近 离散 数据 并 能 维持 统计 误差 最 小 的 数学 解析 表达 式 ， 
也 就 是 拟 合 曲线 的 数学 方程 。 


12.1.2 ”简单 线性 数据 拟 合 的 例子 


回想 一 下 中 学 物理 课 的 “速度 与 加 速度 ”实验 : 假设 某 物 体 正在 做 加 速 运动 ， 加 速度 未 知 ， 
某 实 验 人 员 从 时 间 =3 秒 时 刻 开始 ,以 1 秒 时 间 间 隔 对 这 个 物体 连续 进行 了 12 次 测速 , 得 到 一 
组 速度 和 时 间 的 离散 数据 ( 如 表 12-1 所 示 )， 请 根据 实验 结果 推算 该 物体 的 加 速度 。 
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表 12-1 物体 速度 和 时 间 的 测量 关系 表 
时 间 (s) 3 4 5 6 7 8 9 10 11 12 13 14 


速度 (m/s) | 8.41 9.94 11.58 13.02 14.33 15.92 17.54 19.22 20.49 22.01 23.53 24.47 


在 选择 了 合适 的 坐标 刻度 之 后 ， 我 们 就 可 以 在 坐标 纸 上 面 出 这 些 点 。 如 图 12-1 所 示 ， 排 除 
偏差 明显 偏 大 的 测量 值 后 , 可 以 看 出 测量 结果 呈现 典型 的 线性 特征 。 沿 着 该 线性 特征 画 一 条 直线 ， 
使 尽量 多 的 测量 点 位 于 直线 上 , 或 与 直线 的 偏差 尽量 小 , 这 条 直线 就 是 我 们 根据 测量 结果 拟 合 的 
速度 与 时 间 的 函数 关系 。 最 后 在 坐标 纸 上 测 量 出 直线 的 斜率 及 ,天 就 是 被 测 物体 的 加 速度 。 经 过 
测量 ， 我 们 实验 测 到 的 物体 加 速度 值 是 1.53m/s*， 初 速度 是 3.99my/s。 


vn/s) F 


图 12-1 实验 法 测量 加 速度 的 过 程 


12.2 最 小 二 乘法 曲线 拟 合 
使 用 数学 分 析 进 行 曲线 拟 合 有 很 多 常用 的 方法 ， 这 一 节 我 们 先 介 绍 一 下 最 简单 的 最 小 二 乘 四 于 


法 ， 并 给 出 使 用 最 小 二 乘法 解决 上 一 节 给 出 的 速度 与 加 速度 实验 问题 。 


170 区 第 12 章 实验 数据 与 曲线 拟 合 


12.2.1 最 小 二 乘法 原理 


最 小 二 乘法 ， 又 称 最 小 平方 法 , 是 一 种 通过 最 小 化 误差 的 平方 和 寻找 数据 的 最 佳 函数 匹配 的 
方法 。 利 用 最 小 二 乘法 ， 可 以 简便 地 求 得 未 知 的 数据 , 并 使 得 这 些 求 得 的 数据 与 实际 数据 之 间 误 
差 的 平方 和 为 最 小 。 当 然 ， 作 为 一 种 插值 方法 使 用 时 ， 最 小 二 乘法 也 可 以 用 于 曲线 拟 合 。 使 用 最 
小 二 乘法 进行 曲线 拟 合 是 曲线 拟 合 中 早期 的 一 种 常用 方法 。 不 过 ,最 小 二 乘法 理论 简单 ， 计 算 量 
小 。 即 便 在 使 用 三 次 样 条 曲线 或 RBF (Radial Basis Function ) 进行 曲线 拟 合 大 行 其 道 的 今天 ， 最 
小 二 乘法 在 多 项 式 曲 线 或 直线 的 拟 合 问题 上 , 仍然 得 到 广泛 的 应 用 。 使 用 最 小 二 乘法 ,选取 的 匹 
配 函 数 的 模式 非常 重要 : 如 果 离 散 数据 呈现 的 是 指数 变化 规律 , 则 应 该 选择 指数 形式 的 匹配 函数 
模式 ; 如 果 是 多 项 式 变 化 规律 ， 则 应 该 选择 多 项 式 匹 配 模 式 。 如 果 选 择 的 模式 不 对 ， 拟 合 的 效果 
就 会 很 差 ， 这 也 是 使 用 最 小 二 乘法 进行 曲线 拟 合 时 需要 特别 注意 的 一 个 地 方 。 

下 面 以 多 项 式 模式 为 例 , 介绍 一 下 使 用 最 小 二 乘法 进行 曲线 拟 合 的 完整 步骤 。 假 设 选择 的 拟 
合 多 项 式 模式 是 : 


y=a +axtax t,t+a, Xx” (12-1) 


m 


离散 的 各 点 到 这 条 曲线 的 平方 和 F(aoya1,…, aw) 则 为 : 


F(a = Dy 一 (Ga + ax, + asxX,” 十 十 0 (12-2) 


i=l] 


最 小 二 乘法 的 第 一 步 处 理 就 是 对 五 (a0,q1,… ,am) 分 别 求 对 a; 的 偏 导 数 ， 得 到 m 个 等 式 : 


n 
区 
-2> [y, —(ao +ax t+a 十 二 ao )]=0 
| 


n 
2 
-2 1y, 一 (au+aX +ax; +**+a,xX, )K;=0 
i=] 


-2> [y, —(ao tax t+ax, + + =0 (12-3) 


这 m 个 等 式 相 当 于 m 个 方程 ，a0,q1…,aw 是 m 个 未 知 量 ， 因 此 这 m 个 方程 组 成 的 方程 组 是 
可 解 的 ， 最 小 二 乘法 的 第 二 步 处 理 就 是 将 其 整理 为 针对 a0,a1…,aw 的 正规 方程 组 。 最 终 整 理 的 方 
程 组 如 下 : 


n n n n 
2 

aon+t+a > 3 > Se > 区 ”二 > y; 

i=] i=l i=l i=l 
n n n n n 

2 3 m+l 

a > 和 十 好 > x + > Xx; +…+an > We > Xiy, 

i=l i=] i=l i=l i=l 
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ay xm 十 a x 十 3 十 … 十 qs yx” = Yr"y, (12-4) 

最 小 二 乘法 的 第 三 步 处 理 就 是 求解 这 个 多 元 一 次 方程 组 , 得 到 多 项 式 的 系数 qo, al，…，am， 

就 可 以 得 到 曲线 的 拟 合 多 项 式 画 数 。 求 解 多 元 一 次 方程 组 的 方法 很 多 , 高 斯 消 元 法 是 最 常用 的 一 
种 方法 ， 下 一 节 就 简单 介绍 一 下 这 种 方法 。 


12.2.2 ”高 斯 消 元 法 求解 方程 组 


在 数学 上 ， 高 斯 消 元 法 是 线性 代数 中 的 一 个 算法 ， 可 用 来 求解 多 元 一 次 线性 方程 组 ,也 可 以 
用 来 求 矩 阵 的 秩 ， 以 及 求 可 逆 方 阵 的 道 矩 阵 。 高 斯 消 元 法 虽然 以 数学 家 高 斯 的 名 字 命名 , 但 是 最 
早出 现在 文献 资料 中 应 该 是 中 国 的 《 九 章 算术 六 

高 斯 消 元 法 的 主要 思想 是 通过 对 系数 矩阵 进行 行 变 换 , 将 方程 组 的 系数 矩阵 由 对 称 矩 阵 变 为 
三 角 和 矩阵 ， 从 而 达到 消 元 的 目的 ， 最 后 通过 回 代 逐个 获得 方程 组 的 解 。 在 消 元 的 过 程 中 ， 如 果 某 
一 行 的 对 角 线 元 素 的 值 太 小 , 在 计算 过 程 中 就 会 出 现 很 大 的 数 除 以 很 小 的 数 的 情况 ,有 除法 溢出 
的 可 能 ， 因 此 在 消 元 的 过 程 中 , 通常 都 会 增加 一 个 主 元 选择 的 步 又 ,通过 行 交 换 操作 , 将 当前 列 
绝对 值 最 大 的 行 交 换 到 当前 行 位 置 ， 避 免 了 除法 溢出 的 问题 ， 增 加 了 算法 的 稳定 性 。 

高 斯 消 元 法 的 实现 简单 ， 主 要 由 两 个 步骤 组 成 : 第 一 个 步骤 就 是 通过 选择 主 元 ， 逐 行 消 元 ， 
最 终 形成 方程 组 系数 矩阵 的 三 角 和 矩阵 形式 ; 第 二 个 步骤 就 是 逐步 回 代 的 过 程 , 最 终 和 矩阵 的 对 角 线 
上 的 元 素 就 是 方程 组 的 解 。 下 面 就 给 出 高 斯 消 元 法 的 一 个 算法 实现 : 

/* 带 列 主 元 的 高 斯 消去 法 解 方程 组 ， 最 后 的 解 在 matrixA 的 对 角 线 上 */ 


bool GuassEquation::Resolve(std::vector<double>& xValue) 


{ 


assert(xValue.size() == m DIM); 


/* 消 元 ， 得 到 上 三 角 阵 */ 

for(int i = 0; i < m DIM - 1; i++) 

{ 
/* 按 列 选 主 元 */ 
int pivotRow = SelectPivotalElement(i); 
if(pivotRow 1= i)/# 如 果 有 必要 ， 交 换行 */ 
{ 


SwapRow(i, pivotRow); 

a * m_DIM + ]))/* 主 元 是 0， 不 存在 唯一 解 */ 
return false; 

ee 使 每 行 的 第 一 个 系数 是 1.0*/ 

SimplePivotalRow(i, i); 


/# 逐 行进 行 消 元 #/ 
for(int j = i + 1; j < m DIM; j++) 
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RowElimination(i, j, i); 


} 
} 
/* 回 代 求解 */ 
m matrixA[ (m DIM - 1) * m DIM + m DIM - 1] = m bVal[m DIM - 1] / m matrixA[(m DIM - 1) * m DIM + 
m DIM - 1]; 
for(int i = m DIM - 2; i >= 0; i--) 
{ 
double totalCof = 0.0; 
for(int j = i + 1; j < m DIM; j++) 
{ 
totalCof += m matrixA[i * m DIM + j] * m matrixA[j * m DIM + j]; 
} 
m matrixA[i * m DIM + i] = (m bVal[i] - totalCof) / m matrixA[i * m DIM + i]; 
} 


/* 将 对 角 线 元 素 的 解 逐 个 存 入 解 向 量 */ 
for(int i = 0; i < m DIM; i++) 


{ 
} 


xValue[i] = m matrixA[i * m DIM + i]; 


return true; 


} 

在 GuassEquation: :Resolve() 函 数 中 ,，m matrixA 是 以 一 维 数组 形式 存放 的 系数 矩阵 ，m_DIM 是 
矩阵 的 维 数 ，SelectPivotalEflement() 函 数 从 系数 矩阵 的 第 i 列 中 选择 绝对 值 最 大 的 那个 值 所 在 的 
行 , 并 返回 行 号 ，SwapRow() 函 数 负责 交换 系数 矩阵 两 个 行 的 所 有 值 ，SimplepivotalRow() 函 数 是 归 
一 化 处 理 函 数 ， 通 过 除法 操作 将 指定 的 行 的 对 角 线 元 素 变 换 为 1.0， 以 便 简化 随后 的 消 元 操作 。 


12.2.3 ”最 小 二 乘法 解决 “速度 与 加 速度 ”实验 


根据 12.2.1 节 对 最 小 二 乘法 原理 的 分 析 , 用 程序 实现 最 小 二 乘法 曲线 拟 合 的 算法 主要 由 两 个 
步 又 组 成 , 第 一 个 步骤 就 是 根据 给 出 的 测量 值 生成 关于 拟 合 多 项 式 系 数 的 方程 组 ,第 二 个 步骤 就 
是 解 这 个 方程 组 , 求 出 拟 合 多 项 式 的 各 个 系数 。 根 据 对 上 文 最 终 整 理 的 正规 方程 组 的 分 析 ， 可 以 
看 出 其 系数 有 一 定 的 关系 ， 就 是 每 一 个 方程 式 都 比 前 一 个 方程 式 多 乘 了 一 个 x;。 因 此 ， 只 需要 完 
整 计 算出 第 一 个 方程 式 的 系数 ,其 他 方程 式 的 系数 只 是 将 前 一 个 方程 式 的 系数 依次 左 移 一 位 , 然 
后 单独 计算 出 最 后 一 个 系数 就 可 以 了 , 此 方法 可 以 减少 很 多 无 谓 的 计算 。 求 解 多 元 一 次 方程 组 的 
方法 就 使 用 12.2.2 节 介 绍 的 高 斯 消 元 法 ， 其 算法 上 一 节 已 经 给 出 。 

这 里 给 出 一 个 最 小 二 乘 算法 的 完整 实现 ,以 12.1.2 节 的 数据 为 例 ,因为 数据 结果 明显 呈现 线 
生 方程 的 特征 ， 因 此 选择 拟 合 多 项 式 为 v= vo + at，vo 和 a 就 是 要 求解 的 拟 合 多 项 式 系数 : 

Bool LeastSquare(const std::vector<double>& x value, const std::vector<double>& y value, int M, 


std::vector<double>& a value) 


{ 
assert(x value.size( 
assert(a value.size( 


ma 


y_value.size()); 


) == y_ 
) == M); 
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double *matrix = new double[M * M]; 
double *b= new double[M]; 


std::vector<double> x m(x_ value.size(), 1.0); 
std: :vector<double> y i(y value.size(), 0.0); 
for(int I = 0; I < M; i++) 
{ 
matrix[ARR_INDEX(0, I, M)] = std::accumulate(x m.begin(), x m.end(), 0.0); 
for(int j = 0; j < static cast<int>(y value.size()); j++) 
{ 
y_ilj] = x mlj] * y_value[j]; 


b[i] = std::accumulate(y i.begin(), y i.end(), 0.0); 
for(int k = 0; k < static cast<int>(x m.size()); k++) 


x m[k] *= x value[k]; 


} 

} 

for(int row = 1; row < Mi row+t+) 

{ 
for(int TI = 0; I < M - 1; it+) 
{ 


matrix[ARR INDEX(row, I, M)] = matrix[ARR INDEX(row - 1, I + 1, M)]; 


matrix[ARR_INDEX(row, M - 1, M)] = std::accumulate(x m.begin(), x _m.end(), 0.0); 
for(int k = 0; k < static cast<int>(x m.size()); k++) 


{ 


} 
} 


GuassEquation equation(M, matrix, b); 
delete[] matrix; 
delete[] b; 


x m[k] *= x value[k]; 


return equation.Resolve(a value); 


} 

将 表 12-1 的 数据 带 入 算法 ， 计 算得 到 w= 4.05545455，a = 1.48818182， 比 作 图 法 得 到 的 结 
果 更 精确 。 以 上 算法 是 根据 最 小 二 乘法 的 理论 推导 系数 方程 , 并 求解 系数 方程 得 到 拟 合 多 项 式 的 
系数 的 一 种 实现 方法 。 除 此 之 外 , 还 可 以 利用 预先 计算 好 的 最 小 二 乘 解析 理论 直接 求 得 拟 合 多 项 
式 的 系数 ， 读 者 可 自行 学 习 相 关 的 实现 算法 。 


12.3 三 次 样 条 曲线 拟 合 


曲线 拟 合 基本 上 就 是 一 个 插值 计算 的 过 程 , 除了 最 小 二 乘法 ,其 他 插值 方法 也 可 以 被 用 于 曲 
线 拟 合 。 常 用 的 曲线 拟 合 方法 还 有 基于 RBF 的 曲线 拟 合 和 三 次 样 条 曲线 拟 合 。 最 小 二 乘法 方法 
简单 , 便于 实现 , 但 是 如 果 拟 合 模式 选择 不 当 , 会 产生 较 大 的 偏差 , 特别 是 对 于 复杂 曲线 的 拟 合 ， 
如 果 选 错 了 模式 ， 拟 合 的 效果 就 很 差 。 基 于 RBF 的 曲线 拟 合 方法 需要 高 深 的 数学 基础 ， 涉 及 多 
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维 空间 理论 , 将 低 维 的 模式 输入 数据 转换 到 高 维 空间 中 , 使 得 低 维 空间 内 的 线性 不 可 分 问题 在 高 
维 空间 内 变 得 线性 可 分 , 这 种 数学 分 析 方 法 非常 强大 , 但 是 这 种 方法 不 宜 得 到 拟 合 函数 ， 因 此 在 
需要 求解 拟 合 函 数 的 情况 下 使 用 起 来 不 是 很 方便 。 

样 条 插值 是 一 种 工业 设计 中 常用 的 、 得 到 平滑 曲线 的 一 种 插值 方法 ,三 次 样 条 又 是 其 中 用 得 
较为 广泛 的 一 种 。 使 用 三 次 样 条 曲线 进行 曲线 拟 合 可 以 得 到 非常 高 精度 的 拟 合 结果 , 并 且 很 容易 
得 到 拟 合 函数 , 本 节 的 内 容 将 重点 介绍 三 次 样 条 曲线 拟 合 的 原理 和 算法 实现 , 并 通过 一 个 具体 的 
例子 将 三 次 样 条 函数 拟 合 的 曲线 与 原始 曲线 对 比 显示 , 让 大 家 体会 一 下 三 次 样 条 曲线 拟 合 的 惊人 


12.3.1 插值 函数 


前 面 提 到 过 ， 曲 线 拟 合 的 实质 就 是 各 种 插值 计算 ， 因 此 ,插值 函数 的 选择 决定 了 曲线 拟 合 的 
效果 。 那 么 插值 函数 的 数学 定义 是 什么 呢 ? 若 在 [aw 5b] 上 给 出 n+1 个 点 a 三 x0<xi<*…<x 三 2b， 
flx) 是 [a, 拉 上 的 实 值 函 数 , 要 求 一 个 具有 n+ 1 个 参量 的 函数 s(x; ao ,an) 使 它 满足 


S(Xi; 0G0 “**, an) = fx) ,i=0,1,%,n (12-5) 
则 称 sx) 为 ftx) 在 [a, 5] 上 的 插值 函数 . 若 s(x) 关于 参量 wo, a1…,ay 是 线性 关系 , 即 : 
S(X) = aoso(x) + ais1(X) 十 … + qnsn(X) (12-6) 


s(X) 就 是 多 项 式 插值 函数 ， 如 果 sx) 是 三 角 函 数 ， 则 s(x) 就 是 三 角 插值 也 数 。 

比较 常用 的 多 项 式 插值 函数 是 牛顿 插值 多 项 式 和 拉 格 朗 日 插值 多 项 式 , 但 是 在 多 项 式 的 次 数 
比较 高 的 情况 下 , 插值 点 数 n 过 多 会 导致 多 项 式 插 值 在 收敛 性 和 稳定 性 上 失去 保证 ， 因此， 当 插 
值 点 数 n 较 大 的 情况 下 ,一 般 不 使 用 多 项 式 插值 , 而 采用 样 条 插值 或 次 数 较 低 的 最 小 二 乘法 插值 。 


12.3.2” 样 条 函数 的 定义 


在 所 有 能 够 保证 收敛 性 和 稳定 性 的 插值 函数 中 , 最 常用 也 是 最 重要 的 插值 函数 就 是 样 条 插值 
函数 。 采用 样 条 函数 计算 出 的 插值 曲线 和 曲面 在 飞机 、 轮 船 和 汽车 等 精密 机 械 设计 中 都 得 到 了 广 
泛 的 应 用 。 样 条 插值 函数 的 数学 定义 如 下 。 

设 区 间 [a, 8] 上 选取 nn 一 1 个 节点 (包括 区 间 端 点 a 和 4b 共 n+ 1 个 节点 )， 将 其 划分 为 n 个 子 
区 间 a=xo<xi<…<x,= 2b, 如 果 存 在 函数 s(x)， 使 得 s(x) 满 足以 下 两 个 条 件 : 

(1) sCo 在 整个 区 间 [a, 5] 上 具有 m -1 阶 连续 导数 ; 

(2) s(x) 在 每 个 子 区 间 [xii, 0 二 1,2,…,n 上 是 m 次 代数 多 项 式 ( 最 高 次 数 为 m 次 ); 

则 称 so9 是 区 间 [w, 如上 的 闫 次 样 条 函数 。 假 如 区 间 [c, 5] 上 存在 实 值 函 数 fx)， 使 得 每 个 节点 处 的 
值 Ke) 与 sc 相等 ， 即 
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s(xi) = f(x7), i=0,1,.%,n (12-7) 

则 称 so9 是 实 值 函 数 . hx) 的 m 次 样 条 插值 函数 。 

当 m= 1 时， 样 条 插值 函数 就 是 分 段 线性 插值 ， 此 时 虽然 s(x) 是 属于 区 间 [a, 8] 上 的 也 数 ,但 
它 不 光滑 ( 连 一 阶 连续 导数 性 质 都 不 具备 )， 不 能 满足 工程 设计 要 求 。 工 程 设计 通常 使 用 较 多 的 
是 m=3 时 的 三 次 样 条 插值 函数 ， 此 时 样 条 函数 具有 二 阶 连续 导数 性 质 。 
根据 三 次 样 条 函数 的 定义 ，s(x) 在 每 个 子 区 间 上 的 样 条 函数 _ s(x) 都 是 一 个 三 次 多 项 式 ， 也 
就 是 说 ， 三 次 样 条 函数 s(x) 由 n 个 区 间 上 的 n 个 三 次 多 项 式 组 成 ， 每 个 三 次 多 项 式 可 描述 为 以 
下 形式 : 


siX) = ape rbx tcxtd, i=1,2,.,n (12-8) 
因此 ， 要 确定 完整 的 样 条 函数 s(x) 需 要 确定 a;、bi;、ci 和 4; 公 4n 个 系数 。 根 据 样 条 函数 的 定 
义 ，sQ) 在 区 间 内 的 nn-1 个 节点 处 都 是 连续 的 ， 并 且 其 一 阶 导数 wo 和 二 阶 导数 s," (x) 都 是 连续 
的 ， 根据 连 续 孔 数 的 性 质 (x 的 左右 导数 相等 )， 我 们 可 以 得 到 3(n - 1) 个 条 件 : 
Si(Xi 0) = sin(x; | 0) i= 1,2, …, 1 一 
Si\(Xi 0) = si (x; + 0) 7 一 2 …，, 7 一 
So6 一 0)=Sn (xXi+0) i=1,2,.…,n—l (12-9) 
再 加 上 插值 函数 在 包括 区 间 端 点 a (就 是 zxo ), 5( 就 是 x ) 在 内 的 n+ 1 个 节点 处 满足 s(x) = 
fo)， 又 可 以 得 到 n+ 1 个 条 件 ， 这 样 就 具备 了 4n - 2 个 条 件 。 


12.3.3 ”边界 条 件 


为 了 解决 4n 个 系数 组 成 的 方程 组 ， 最 终 确定 的 soo) ， 需 要 再 补充 两 个 边界 条 件 使 之 满足 4n 
个 条 件 。 常 用 的 边界 条 件 有 以 下 几 种 。 
第 一 类 边界 条 件 ， 即 满足 s(xo) = 了 "(xo)，s' Co) = 广 Co) 两 个 条 件 ， 其 中 ftx) 是 实 值 函数。 
第 二 类 边界 条 件 ， 即 满足 s"(xo) = Fo0，s"oo = 了 A" (x) 两 个 条 件 ， 其 中 fx) 是 实 值 函 数 。 特 
别 情况 下 ， 当 了 "(x0) = 了 "(xw) = 0 的 时 候 ， 也 就 是 s"” Co) =s" Co) = 0 的 时 候 ， 第 二 类 边界 条 件 又 
被 称 为 自然 边界 条 件 。 

当 样 条 函数 的 实 值 函 数 fx) 是 以 [a, 5] 为 周期 的 周期 函数 时 ， 三 次 样 条 函数 s(x) 在 两 个 端点 处 
满足 s'xo 一 0)= so+0) 和 s"(xo 一 0)=s" x+0)， 这 种 情况 又 称 为 第 三 类 边界 条 件 。 

工程 技术 中 常用 的 是 第 一 类 边界 条 件 和 第 二 类 边界 条 件 , 以 及 第 二 类 边界 条 件 的 特殊 情况 自 
然 边界 条 件 。 理想 情况 下 ,也 就 是 实 值 函 数 已 知 的 情况 下 ,可 以 通过 实 值 函 数 直 接 计 算出 边界 条 
件 的 值 , 否则 的 话 , 就 只 能 通过 测量 和 计算 得 到 边界 条 件 的 值 , 有 时 候 甚 至 只 能 给 出 经 验 估计 值 ， 
工程 技术 中 通常 根据 实际 情况 灵活 使 用 各 类 边界 条 件 。 
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12.3.4 推导 三 次 样 条 函数 


求 三 次 样 条 搬 值 函数 s(x) 的 方法 很 多 ， 其 基本 原理 都 是 首先 求 出 由 待定 系数 组 成 的 s(x)， 以 
及 其 一 阶 导 数 s'(x) 和 二 阶 导 数 s" (x)， 然 后 将 其 带 入 到 12.3.2 节 和 12.3.3 节 列 举 的 4n 个 条 件 中 ， 
得 到 关于 待定 系数 的 方程 组 ， 最 后 求解 方程 组 得 到 待定 系数 ， 并 最 终 确定 插值 函数 s(x)。 

求 三 次 样 条 插值 函数 s(x) 常 用 的 方法 是 “三 转角 法 ”和 “三 弯 算 法 ”。 根 据 三 次 样 条 函数 的 性 
质 ，s(7) 的 一 阶 导数 s' (x) 是 二 次 多 项 式 ， 二 阶 导 数 "9 是 一 次 多 项 式 〈 线 性 函数 ),，“ 三 转角 法 ” 
和 “三 弯 矩 法 ”的 主要 区 别 是 利用 这 两 个 特性 推导 插值 汕 数 s(x)、s'(Y) 和 s"(x) 的 方式 不 同 。“ 三 转 
角 法 ”利用 s(x) 的 一 阶 导数 st) 是 二 次 多 项 式 这 个 特性 ， 对 于 子 区 间 [x, xl， 利 用 抛物 线 插值 公 
式 获得 一 个 通过 x 和 x 两 个 点 的 二 次 多 项 式 作 为 s' (x)， 然 后 对 s' (0) 进行 积分 和 微分 ( 求 导 ) 运 
算 ， 分别 得 到 s(x)， 和 s"(x)， 最 后 将 它们 带 入 4n 个 条 件 中 求解 系数 方程 组 。 “三 弯 和 矩 法 ” 则 是 利 


用 9 的 二 阶 导数 "09 是 一 次 多 项 式 (线性 函数 ) 这 个 特性 ， 对 于 子 区 间 [x xa1]， 首 先 假设 一 个 
通过 和 xai 两 个 点 的 线性 函数 作为 s"(x), 然后 对 "进行 连续 两 次 积分 运算 得 到 s(x)， 再 对 s(x) 
进行 求 导 得 运算 到 s' (x)， 最 后 将 它们 带 入 4n 个 条 件 中 求解 系数 方程 组 。 这 两 种 方法 的 本 质 是 一 


样 的 ， 只 是 对 Co 的 推导 过 程 不 同 ， 接 下 来 就 介绍 使 用 “三 弯 矩 法 ”求解 三 次 样 条 函数 的 方法 。 


三 次 样 条 函数 的 求解 过 程 就 是 系数 方程 组 的 推导 过 程 ， 使 用 “三 弯 矩 法 ”推导 系数 方程 组 ， 
首先 要 确定 插值 函数 的 二 阶 导数 s"(x)。 根 据 三 次 样 条 函数 的 性 质 ， 在 每 个 子 区 间 [x;, xx 上， 其 
二 阶 导数 "9 是 个 线性 方程 ， 现 在 假设 在 志和 xl 两 个 端点 的 二 阶 导数 值 分 别 是 Mi 和 Ml， 也 


就 是 SC) = M.;, S "(Xit1) Man ， 则 经 过 xi 和 Xitl 的 两 点 式 直 线 方程 是 : 
y—M, Mi -MM; 


XX Xn Xi 


i 


经 过 变换 可 以 得 到 s,"(x) 


1 Nin ~ 
=s"(x)= 
(ey 


i+tl 


Mat M, 其 中 hi= x 一 Xi 


i i 


对 si"(X) 进 行 两 次 积分 ， 得 到 Si(X), 其 中 4; 和 B; 都 是 常量 : 


x 3 
$0 = Ce 3 M+ M+Ax+B, 其 中 hi= Xi — Xi 


i 


根据 式 (12-7) 插 值 条 件 ， Si(Xi) 二 Ji Si(Xit1) 一 Jr+l， 将 这 两 个 条 件 带 入 到 式 (12-12)， 


这 两 个 等 式 恰好 是 一 个 关于 4; 和 B; 的 二 元 一 次 方程 组 : 


二 区 
+A th 二 


i 


ut AXxin + B,= yi 


Cn —x) M 
6h, 


i 


(12-10) 


(12-11) 


(12-12) 


得 到 两 个 等 式 ， 


(12-13) 
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因为 =xini 一 Xt?， 带 入 式 (12-13) 后 简化 等 式 ， 并 求解 这 个 方程 组 ， 得 到 4; 和 B; 分 别 是 : 


A4= yu—y Mn—M, h 
h, 6 


: 


M,, Virr Mi —M, 
B,= yy, i ( 和 本 hx 


(12-14) 


将 4 和 B; 带 入 式 (12-12)， 得 到 完整 的 si(x): 


= Cn 一 2 (x—x) 44， Xirl 一 M i, 2 XX 
Si(X) 本 Mi+ 6h (入 一 人 ) 一 一 一 = 6 h ee (12-15) 
其 中 只 有 Mi 和 Mi 是 未 知 的 系数 量 , 只 要 求 得 M; 和 Mi 的 值 , 就 能 够 确定 完整 的 样 条 函数 s(x)。 
要 求解 M; 和 Mir1， 还 需要 利用 三 次 样 条 函数 的 一 阶 导 函 数 的 一 些 性 质 增加 一 些 计 算 条 件 ， 因 此 


还 要 求 其 一 阶 导 函数 si(x)。 只 需 对 so) 求 导 ， 就 可 以 得 到 sw 的 一 阶 导数 so: 


Si (xz) = (Xi — x)” MI， CC 一 x,) M+ yi M,, —M., -万 (12-16) 
2h, 2h h 


i 


根据 三 次 样 条 函数 的 特性 ， 其 一 阶 导数 sx) 在 节点 x; 处 是 连续 的 ， 就 可 以 利用 式 (12-9) 的 第 
二 个 条 件 ， 即 sj'() 在 节点 x; 处 左右 导数 相等 的 特性 ， 再 获得 一 些 求 解 关于 M 的 条 件 。 根 据 左 导 
数 的 定义 : 


sc —0) = eM EA + HM, i=1,2,… nn-1 (12-17) 
ee 3 
同样 ， 根 据 右 导数 的 定义 : 
s(x +0) = M+ Ms i=1,2," nl1 (12-18) 


由 式 (12-17) 和 式 (12-18) 可 以 得 到 一 个 等 式 ， 将 M1、M; 和 Mi 做 为 变量 ,将 等 式 整理 成 关于 Mi 
的 方程 : 


MM 1 (2.19) 
1 有 + 站 由 
用 及 Din — Hi) 、 4 
今夏 站 1 一 1 ,Vy =]—u, Pe i ， d.= i+l i i i-l 将 其 带 人 式 12-19 得 
eh /及 人 PR 
到 简化 的 等 式 : 
uM, +2M, +v Ms =d i=1,2,,n-l (12-20) 


从 MW 到 M, 有 nt+tl 个 Mi 的 值 需 要 求解 ， 但 是 式 (12-20) 只 有 n-1 个 等 式 ， 此 时 就 需要 用 到 两 vv 


将 第 二 类 边界 条 件 得 到 的 式 (12-23) 和 式 (12-24) 或 第 一 
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个 边界 条 件 了 。 
如 果 是 使 用 第 二 类 边界 条 件 ， 则 直接 可 以 得 到 以 下 两 个 条 件 等 式 : 
S$"(x0) = Mo =f "(x0) = yo (12-21) 
S$" (Xn) = Ms =f "(Xn) = pn (12-22) 
令 do= 2y0", di = 2yn ， 可 以 得 到 由 第 二 类 边界 条 件 确定 的 两 个 方程 : 
2Mo = do (12-23) 
2Mn = d (12-24) 
如 果 是 使 用 第 一 类 边界 条 件 ， 即 s(x0)= 了 (x0)，s'(xw) = 了 x) 两 个 条 件 ， 则 需要 将 这 两 个 条 件 
代入 式 (12-16)， 通 过 计算 得 到 两 个 条 件 等 式 。 将 s' (xo) =yo 代 入 式 (12-16)， 得 到 : 
6 BA yo f 
2M +M, = 一 = 12-2 
ot Ee 六 yo') ( 5) 
将 seo) = 代入 式 (12-16)， 得 到 : 
M1 +2M, = Or- 攻 2 (12-26) 
令 而 = 让 全 于) ,= 于 -0 一 上 一) ， 可 将 式 (12-23) 和 式 (12-24) 简 化 为 
2Mo + Mi 一 do (12-27) 
M1+2M,=d, (12-28) 


类 边界 条 件 得 到 的 式 (12-27) 和 式 (12-28) 


与 式 (12-20) 中 的 n-1 个 等 式 组 合 在 一 起 就 


导 到 一 个 关于 Mi 的 方程 组 ， 求 解 此 方程 组 可 以 得 到 Mi; 


的 值 ,代入 到 式 (12-15) 即 可 得 到 三 次 样 条 


函数 方程 ,以 第 一 类 边界 条 件 得 到 的 式 (12-27) 和 式 (12-28) 


为 例 ， 与 式 (12-20) 连 立 得 到 以 下 方程 组 : 

2 办 Mu | [a 

Uu 2 v LI dl 
; : |=| : (12-29) 

UW 2 Vg M ,1 di 

六 闻 . - 没 M, | d, 
这 就 是 三 弯 矩 方程 组 ， 其 中 M;， 广 0,1,…, n 就 是 三 次 样 条 函数 s(x) 的 和 矩 。 根 据 式 (12-27) 和 式 
(12-28)， 攻 =1，w=1， 其 余 各 系数 可 以 通过 式 (12-19) 中 的 系数 计算 出 来 。 这 个 方程 组 的 系数 矩 


阵 是 一 个 对 角 线 矩阵 ， 并 且 是 一 个 严格 对 角 占 优 的 对 角 阵 (w; 和 vi 的 值 均 小 于 主 对 角 线 的 值 ， 也 
就 是 uw 和 vi 的 值 蛋 小 于 2 )， 可 以 使 用 追赶 法 求解 。 下 一 节 将 介绍 如 何 使 用 追赶 法 求解 方程 组 
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并 给 出 求解 的 算法 实现 。 


12.3.5 ”追赶 法 求解 方程 组 


任意 矩阵 4 都 可 以 通过 克 洛 脱 〈Crout ) 分 解 得 到 两 个 三 角 和 矩阵: 
[a 2 Qi hi 1 Wy Wn 
总 7， 17 和 
Ee ”|=LU ,如果 4 是 对 角 和 矩阵 ， 则 
[Ql 12 i Qn 同 2 人 L, kk 1 
克 治 脱 分 解 的 结果 为 : 
[a 六 | Ws 和! 全 | 
b, a, cC， m, J 1 "6 
A ms J, 1 uu 
4= 2 = 
bi Qi Cn M1 Li 1 Ui 
b, a, m, ,| 1 | 


在 分 解 后 的 矩阵 中 ， l=a1, ui=c/li, 其 余 各 项 的 计算 规则 如 下 : 


m, =b,i=2,3,.,n 
Li=a—mu,i=2,3 4 


Ww = 


在 得 到 了 各 个 系数 后 ， 原 广 和 组 就 可 以 分 角 为 丙 个 方程 组， 印 ， 妈 4 二 全 ,对 于 第 一 个 
方程 ， 求 解 向 量 y: 


六 i yi i | d, | 
m, J, )2 d, 
ms bs 水 区 d; 
P| Li nl di 

Mm, L, E pn J bs n J 


其 中 y1=d1/1i ， 其 余 各 项 的 递 推 计算 关 是 
a (di | myi)/l;, j= 2,3,"°,n 
对 于 第 二 个 方程 ， 求解 最 终结 果 x;: 
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中 x,=yr， 其 余 各 项 的 递 推 求解 关 系 是 : 


Ul 2 7 
1 U, 2 J 
1 了 2 | | 
1 Ui Xi Vn 
1 Ly 
Xi=yi— Uxa, i=n—1,n—2,..,1 


递 推 计 算 六 和 x; 的 过 程 分 别 被 形象 地 形容 为 “ 追 的 过 程 ” 和 “ 赶 的 过 程 ”'， 这 也 是 追赶 法 得 


名 的 原因 ,实际 上 这 种 方法 在 国际 上 叫 作 托 马 
分 解 需要 满足 几 个 条 件 ， 否 则 无 法 进行 ， 这 


(1) a, #0,i=2,3,.…,n 


(2) 
G 


al|>le, 


a, 


? 


二 


di| > 上 |+|e 


n 


,1 


=2.3,…,7 -1 


斯 法 。 在 这 里 需要 强调 一 下 ,对 三 角 和 矩阵 的 克 洛 脱 
几 个 条 件 分 别 是 : 


下 面 就 给 出 一 个 追赶 法 求解 方程 组 的 通用 算法 实现 , 在 使 用 之 前 需要 判断 系数 矩阵 是 否 是 对 
三 角 和 矩阵 ， 并 且 满 足 上 述 三 个 条 件 ， 相 关 的 判断 请 读 考 自行 添加 : 


/# 追 赶 法 求 对 三 角 憩 


阵 方程 组 的 解 #/ 


bool ThomasEquation: :Resolve(std: :vector<double>& xValue) 


{ 


assert(xValue.size() 


PF EF | 


td: :vector<doubl 
td: :vector<doubl 
td: :vector<doub 
td: :vector<doub 


= m matrixA 
= m matrixA 
= m bVal[0] / Lo 
ti=1;i<mD 


m 
m 
m 
( 


matrixA 


m bVal[i 


ARR_I 
ARR I 


/* 回 代 求 解 ， 赶 的 过 程 */ 


xValue 
for(int 


{ 


xValue[i 


] 汪 


m DIM - 1] = Y[m D 
i= m DIM - 2; i >= 0; i--) 


Y[il - U[ 


m_ DIM); 


0, m DIM) ] ; 
1, m DIM)] 


NDEX(i, i - 41, 
INDEX(i, i, m DI 
NDEX(i - 1, i 
i] * Y[i - 1]) 


Ms 


i] * xValue[i + 


"i 


m 
M) 
m 
/ 


1]; 
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} 


return true; 


} 
12.3.6 三 次 样 条 曲线 拟 合 算法 实现 


根据 12.3.4 节 对 三 次 样 条 函数 的 推导 分 析 , 三 次 样 条 曲线 拟 合算 法 的 核心 可 分 为 三 部 分 , 第 
一 部 分 是 根据 推导 结果 计算 关于 三 次 样 条 函数 的 “和 矩 ” 的 方程 组 的 系数 和 矩阵 ， 第 二 部 分 就 是 用 追 
赶 法 求解 方程 组 ， 得 到 各 个 区 间 的 三 次 样 条 函数 ， 第 三 部 分 就 是 根据 每 个 拟 合 点 的 输入 的 值 x;， 
确定 使 用 哪个 区 间 的 三 次 样 条 函数 ,并 使 用 该 区 间 的 三 次 样 条 函数 计算 出 三 次 样 条 插值 y,， 最 后 
得 到 的 一 系列 (x, yi ) 组 成 的 曲线 就 是 三 次 样 条 拟 合 曲线 。 拟 合算 法 也 是 按照 上 面 的 分 析 ， 分 以 
下 三 个 步骤 计算 插值 。 
第 一 步 是 计算 系数 矩阵 , 其 中 wo、vo、qdo 和 qd, 的 值 需 要 单独 计算 , 其 余 的 值 可 以 通过 式 (12-19) 
递 推 计算 出 来 。 
第 二 步 是 将 系数 矩阵 代入 12.3.5 节 给 出 的 追赶 法 通用 算法 ， 求 出 M; 的 值 。 求 解 之 前 ， 先 证 
明 一 下 第 一 步 得 到 系数 矩阵 是 否 满足 追赶 法 的 条 件 。 首先, 主 对 角 线 元 素 的 值 都 是 2, 满足 12.3.5 
节 的 条 件 ()。 其 次 ， 由 到 和 六 的 计算 条 件 可 知 ， 思 < 1，|vi < 1， 这 也 满足 12.3.5 节 的 条 件 (2)。 
最 后 ， 因 为 a;= 2， 且 ww 和 vw 的 和 是 1， 所 以 12.3.5 节 的 条 件 (3) 也 得 到 了 满足 。 由 上 判断 可 知 ， 
求解 三 次 样 条 函数 的 “和 矩 ” 的 系数 矩阵 满足 使 用 追赶 法 求解 的 条 件 ， 可 以 使 用 追赶 法 求解 。 
第 三 步 是 计算 插值 ， 需 要 将 第 二 步 计算 得 到 的 Mi 代入 式 (12-13)， 并 选择 合适 的 子 区 间 样 条 
函数 计算 出 插值 点 的 值 。 

下 面 就 给 出 采用 三 弯 矩 法 实现 的 三 次 样 条 曲线 拟 合算 法 ，Calcspline() 函 数 的 参数 Xi 和 Yi 
是 n 个 插值 点 (包括 起 点 和 终点 ) 的 值 ，boundType 是 边界 条 件 类 型 ，b1 和 b2 分 别 是 对 应 的 两 个 
边界 条 件 ， 这 个 算法 支持 第 一 类 和 第 二 类 边界 条 件 ( 包括 自然 边界 条 件 )。 内 部 的 矩阵 matrixA 
就 是 按照 公式 (12-29) 构 造 的 MK 方程 组 的 系数 矩阵 ,可 用 于 直接 用 追赶 法 求解 方程 组 。Calcspline() 
函数 的 大 部 分 代码 都 是 在 构造 M; 方 程 组 的 系数 和 矩阵， 首先 根据 边界 条 件 确 定 wu, 、vo。、do 和 d， 
其 他 系数 则 根据 式 (12-19) 的 递 推 关系 , 在 for(int i = 1; i < (myvalN - 1); i++) 循 环 中 依次 计算 
出 来 ， 最 后 是 利用 12.3.5 节 给 出 的 追赶 法 算法 求 出 M;。GetValue() 函 数 负责 计算 给 定 区 间 内 任意 
位 置 的 插值 ， 首 先 根据 x 的 值 确定 使 用 哪个 子 区 间 的 样 条 函数 ， 然 后 根据 式 (12-12) 和 式 (12-14) 
给 出 的 关系 计算 插值 。 


void SplineFitting::CalcSpline(double *Xi, double *Yi, int n, int boundType, double b1, double b2) 


assert((boundType == 1) || (boundType == 2)); 


double *matrixA = new double[n * n]; 
if(matrixA == NULL) 
{ 


return; 
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} 
double *d = new double[n]; 
if(d == NULL) 
{ 
delete[] matrixA; 
return; 


} 


m valN = n; 

m valXi.assign(Xi, Xi + m valN); 

m valYi.assign(Yi, Yi + m valN); 

m valMi.resize(m valN); 

memset(matrixA, 0, sizeof(double) * n * n); 


matrixA[ARR INDEX(0, 0, m valN)] = 2.0; 
matrixA[ARR INDEX(m valN - 1, m valN - 1, m valN)] = 2.0; 
if(boundType == 1) /* 第 一 类 边界 条 件 */ 


matrixA[ARR INDEX(0, 1, m valN)] = 1.0; //vO 
matrixA[ARR_INDEX(m valN - 1, m valN - 2, m valN)] = 1.0; //un 
double ho = Xi[1] - Xi[0]; 

d[0] = 6 * ((Yi[14] - Yi[0]) / ho - b1) / ho; //do 

double hn 1 = Xi[m valN - 1] - Xi[m valN - 2]; 
6 


dim valN - 4] = 6 * (b2 - (Yi[m valN - 1] - Yi[m valN - 2]) / hn 1) / hn 1; //dn 
+: 
else /* 第 二 类 边界 条 件 */ 
{ 
matrixA[ARR INDEX(0, 1, m valN)] = 0.0; //vO 
matrixA[ARR INDEX(m valN - 1, m valN - 2, m valN)] = 0.0; //un 
d[0] = 2 * b1; //do 
dlm valN - 1] = 2 * b2; //dn 
} 
/* 计 算 ui,vi,di, i = 2,3,...,n-1*/ 


for(int i = 1; i < (m valN - 1); i++) 


{ 
double hi 1 = Xi[i] - Xxi[i - 1]; 
double hi = Xi[i + 1] - Xi[i]; 
matrixA[ARR INDEX(i, i - 1, m valN)] = hi 1 / (hi 1 + hi); //ui 
matrixA[ARR INDEX(i, i, m valN)] = 2.0; 
matrixA[ARR INDEX(i, i + 1, m valN)] = 1 - matrixA[ARR INDEX(i, i - 1, m valN)]; //vi = 1 - 
ui 
d[i] = 6 * ((Yifi + 4] -= Yi[i]) / hi - (Yi[i] -yi - 1]) / hi 4) / (hi 4 + hi); //di 
} 
ThomasEquation equation(m valN, matrixA, d); 
equation.Resolve(m valMi); 
m bCalcCompleted = true; 


delete[] matrixA; 


delete[] d; 
} 
double SplineFitting::GetValue(double x) 
{ 


if(!Im bCalcCompleted) 
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{ 
return 0.0; 

} 

if((x < m valXi[0]) || (x > m valXi[m valN - 1])) 
return 0.0; 

} 

int i = 0; 

for(i = 0; i < (m valN - 1); i++) 

{ 
if((x >= m valXi[i]) 8&& (x < m valxXi[i + 1])) 

break; 
} 


double hi = m valXi[i + 1] - m valXi[i]; 
double xi 1 = m valXi[i + 1] - x; 
double xi = x - m valXi[i]; 


double y= xi 1 * xi 1* xi1*myva 


Mi[i] / (6 * hi); 
y += (xi * xi * xi * m valMi[i + 1] 7 (6G: 


hi)); 


double Ai = (m valYi[i + 1] - m valYi[i]) / hi - (m valMi[i + 1] - m valMi[i]) * hi / 6.0; 
y += Ai * x; 
double Bi = m valYi[i + 1] - m valMi[i + 1] * hi * hi / 6.0 - Ai * m valXi[i + 1]; 
y += Bi; 
return y; 


} 
12.3.7 ”三 次 样 条 曲线 拟 合 的 效果 


本 节 将 用 定义 一 个 原始 函数 ， 从 原始 函数 的 某 个 区 间 上 抽取 9 个 插值 点 , 根据 这 9 个 插值 点 
和 原 函 数 的 边界 条 件 ， 利 用 三 次 样 条 曲线 插值 进行 曲线 拟 合 ， 并 将 原始 曲线 和 拟 合 曲线 做 对 比 ， 
展示 一 下 三 次 样 条 曲线 拟 合 的 效果 。 


首先 定义 原始 函数 : 


3 
f(x)= Ti 
选择 区 间 [0.0, 8.0] 上 的 9 个 点 作为 插值 点 ， 计 算 各 点 的 值 如 表 12-2 所 示 : 


表 12-2 原 函 数 f(x) 在 各 插值 点 的 值 
x 0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 
y 3.0 1.5 0.6 0.3 0.1765 0.1154 0.0811 0.06 0.0462 


求 0) 的 导 函 数 了 x): 


f (0) = 


人 ) 
根据 了 '(x) 计 算出 在 区 间 端 点 处 的 两 个 第 一 类 边界 条 件 f'(0.0)=0.0, 了 '(8.0)= 一 0.01136。 利 用 
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表 12-2 中 的 数据 和 这 两 个 边界 条 件 ， 计 算出 三 次 样 条 插值 函数 ， 并 从 0.0 开始， 以 0.01 为 步 长 ， 
连续 求 800 个 点 的 插值 , 将 这 些 点 连 成 曲线 得 到 拟 合 曲 线 。 为 了 做 对 比 , 同样 从 0.0 开始 , 以 0.01 


为 步 长 ， 用 ftx) 函 数 连续 计算 800 个 点 的 原 值 ， 将 这 些 点 连 成 曲线 得 到 原始 曲线 。 分 别 用 不 同 的 
颜色 画 出 这 两 条 曲线 ， 如 图 12-2 所 示 。 
站 | 


一 一 原 函 煞 曲 线 


一 一 三 次 样 条 函数 曲线 


图 12-2 拟 合 曲线 和 原始 曲线 对 比 
从 图 12-2 可 以 看 到 ， 三 次 样 条 曲线 拟 合 的 效果 非常 好 。 同 样 在 [0.0, 8.0] 区 间 上 ， 如 果 增 加 插 
值 点 的 个 数 , 将 获得 更 好 的 拟 合 效果 。 比 如 以 0.5 为 单位 , 将 插值 点 增加 到 17 个 ， 则 拟 合 的 曲线 
与 原始 曲线 几乎 完全 重合 。 


12.4 ”总 结 


本 章 介绍 了 两 种 常见 的 曲线 拟 合算 法 : 最 小 二 乘 插 值 法 和 三 次 样 条 曲线 插值 法 ,并 通过 两 个 
简单 的 例子 介绍 了 两 种 算法 的 应 用 场景 。 无 论 是 这 两 种 插值 算法 , 还 是 求解 方程 组 的 高 斯 消 元 法 
和 追赶 法 ,都 是 非常 简单 的 算法 ,实现 也 不 复杂 , 但 是 在 现实 生活 中 却 到 处 都 有 体现 。 小 到 一 个 
物理 实验 ， 大 到 工业 制造 , 算法 的 应 用 无 处 不 在 。 但 是 ,它们 都 很 简单 ， 并 不 神秘 ， 如 果 你 也 有 
这 种 感觉 ， 本 章 的 目的 就 达到 了 。 
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非 线 性 万 程 己 牛 帧 壕 介 ) 


一 元 非 线性 方程 的 求解 是 高 等 数学 研究 的 重要 课题 之 一 ， 早 在 2000 多 年 前 ， 古 巴比伦 的 数 
学 家 就 能 解 一 元 二 次 方程 了 ,中国 的 《 九 章 算术 》 也 有 对 一 元 二 次 方程 求解 的 记载 。 目 前 人 们 普 
遍 认为 低 阶 (5 阶 以 下 ) 一 元 非 线性 方程 可 以 通过 求 根 公式 求解 ， 但 是 高 于 或 等 于 5 阶 的 一 元 非 
线性 方程 不 存在 求 根 公式 ， 要 精确 求解 非常 困难 。 对 高 阶 方程 ,一 般 采 用 迭代 法 近似 求解 ， 午 顿 
迭代 法 因为 方法 简单 ， 和 迭代 收敛 速度 快 而 被 广泛 使 用 。 在 第 11 章 介绍 历法 算法 的 时 候 ， 你 也 可 
以 看 到 牛顿 迭代 法 可 用 来 求解 节气 和 朔 日 时 间 。 


13.1 非 线 性 方程 求解 的 常用 方法 


一 元 非 线性 方程 的 常用 求解 方法 有 很 多 ,能 够 精确 求解 的 方法 有 开平 方法 、 配 方法 、 因 式 分 
解法 、 公 式 法 等 ， 近 似 求解 的 方法 有 作 图 法 以 及 各 种 迭代 法 。 开 平方 法 、 配 方法 和 因 式 分 解法 适 
用 于 一 元 非 线性 方程 中 的 一 些 特殊 情况 , 使 用 范围 有 限 。 公 式 法 适用 于 低 阶 方程 ,对 于 一 元 二 次 
方程 可 以 使 用 韦 达 公式 , 一 元 三 次 方程 可 以 使 用 卡尔 丹 公式 或 威 金 公式 , 公式 法 比较 适合 编写 计 
算 机 算法 求解 。 作 图 法 简单 ， 但 是 精度 不 高 ， 可 用 于 使 用 迭代 法 时 估计 和 迭代 初始 值 。 

由 迭代 法 求 近 似 解 有 很 多 种 方法 ， 有 一 些 迭 代 法 受 函 数 性 质 的 影响 ,收敛 特性 不 是 很 好 ,有 
些 情况 下 如 果 初 始 值 选择 不 当 可 能 会 导致 迭代 不 能 收敛 。 本 童 要 介绍 的 二 分 逼近 法 和 牛顿 迭代 法 
都 是 计算 机 程序 中 常用 的 两 种 算法 ,都 具有 比较 好 的 收敛 速度 。 此 外 ,公式 法 因为 算法 简单 ,在 
许多 特定 领域 内 的 软件 中 也 有 广泛 的 应 用 。 


13.1.1 公式 法 
一 元 二 次 方程 的 求解 是 中 学 数学 的 内 容 ， 对 于 一 元 二 次 方程 的 一 般 形 式 : ax? + bx +c= 0， 
可 使 用 韦 达 公式 求解 方程 的 两 个 实数 解 ， 韦 达 公式 可 表示 为 : 
= —b+Vb’ —4ac 


2a 
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其 中 A=b” - 4ac 是 解 的 判别 式 ， 当 A>0 时 ， 方 程 有 两 个 不 相等 的 实数 解 ， 当 A=0 时 ， 方程 有 两 
个 相等 的 实数 解 , 当 A<0 时 ,方程 没有 实数 解 。 高 等 数学 引信 了 复数 域 和 虚数 单位 产 = -1 , 当 A<0 
时 ， 方 程 有 两 个 不 相等 的 复数 解 。 


一 元 三 次 方程 也 有 求 根 公式 ， 比 如 卡尔 丹 公 式 和 盛 金 公式 。 卡 尔 丹 公式 已 经 有 四 百 多 年 的 历 
史 ， 盛 金 公式 则 是 由 中 国 数学 家 范 盛 金 在 20 世纪 80 年 代 发 明 的 一 种 方法 ， 比 卡尔 丹 公式 简洁 实 
用 。 在 卡尔 丹 公 式 出 现 以 后 ， 人们 又 致力 于 一 元 四 次 方程 的 求 根 公式 ,最 终 卡尔 丹 的 学 生 费 拉 里 
给 出 了 求解 一 元 四 次 方程 的 求 根 公式 。 在 此 后 的 三 百 多 年 时 间 里 , 人 们 苦 等 的 一 元 五 次 方程 的 求 
根 公式 始终 没有 出 现 ， 很 多 著名 数学 家 的 尝试 也 都 没有 结果 。 直 到 1824 年 ， 挪 威 数学 家 阿 贝尔 
证 明了 五 次 或 五 次 以 上 的 方程 不 可 能 有 求 根 公式 ( 这 个 结论 目前 还 有 争议 ,因为 少数 特殊 的 5 阶 
方程 被 证 明 有 求解 公式 )。 

公式 法 可 以 求 得 精确 解 ， 并且 根据 公式 法 的 推导 公式 编写 计算 机 算法 非常 简单 ,因此 这 样 的 
算法 在 很 多 领域 中 得 到 了 广泛 的 使 用 。 


13.1.2 ”二 分 逼近 法 


对 于 实数 域 的 函数 fx)， 如 果 存 在 实数 k， 使 得 ff) = 0， 则 x= 就 是 函数 ftx) 的 零点 。 如 果 
函数 ftx) 在 是 连续 函数 ， 且 在 区 间 [a, b] 上 是 单调 函数 ， 只 要 fa) 和 fp) 异 号 ， 就 说 明 在 区 间 [a, 如 
内 一 定 有 零点 ， 此 时 就 可 以 使 用 二 分 允 近 法 近似 地 找到 这 个 零点 。 假 设 在 上 述 区 间 上 , fa) <0， 
JAD)>0， 则 可 按照 以 下 过 程 实 施 二 分 逼近 法 。 

(1) 如 果 Ka+rp)/2)=0， 则 (ao+b)/2 就 是 零点 ; 

(2) 如 果 KA(a+25)/2)<0， 则 零点 在 区 间 [(a+25)/2,5] 上 ，, 令 a=(atb)/2, 继续 从 第 (1) 步 开始 判断 ; 

(3) 如 果 K(a+t5)/2)>0， 则 零点 在 区 间 [a, (a+25)2] 上 , 令 5=(a+5b)/2, 继续 从 第 (1) 步 开始 判断 。 


直接 按照 K(a+5)/2)=0 判断 是 很 难 的 , 通常 只 要 Ka+b)/2) 在 精度 允许 的 范围 内 逼近 0 时 就 可 
以 结束 二 分 逼近 过 程 , 将 (ac+p)/2 作为 零点 ,在 精度 和 计算 速度 二 者 之 间 取 折衷 。 除 了 判断 X(c+p)/2) 
的 值 , 还 可 以 根据 区 间 [a, 5] 的 大 小 确定 结束 条 件 , 在 精度 允许 的 范围 内 ,只 要 区 间 范 围 小 于 精度 
闵 值 ， 也 可 以 直接 取 (a+5)/2 作为 零点 。 


从 上 述 过 程 可 以 看 到 ,每 次 运算 之 后 ,区间 范 围 就 缩小 一 半 ， 呈现 线性 收敛 速度 。 二 分 法 的 
局 限 性 就 是 不 能 计算 复 根 和 重 根 ， 需 要 借助 其 手段 确定 零点 所 在 区 间 。DichotomyEquation() 函 数 
就 是 二 分 通 近 法 的 算法 实现 ， 参 数 和 4b 是 求 根 区 间 ，f 是 求 根 方程 。 设 方程 为 ftx)=2x? +3.2x 一 
1.8， 求 根 精 度 是 PRECISION = 0.000000001， 在 [-0.8, 8.0] 区 间 上 求解 x = 0.440967364，while 循环 
共 做 了 34 次 循环 迭代 。 


double DichotomyEquation(double a, double b, Functionptr f) 
{ 

double mid = (a + b) / 2.0; 

while((b - a) > PRECISION) 

{ 
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if(f(a) * f(mid) < 0.0) Ce 
{ 
b = mid; 


} 


else 


{ 


a = mid; 


mid = (a + b) / 2.0; 


} 


return mid; 


} 


13.2 ”牛顿 迭代 法 的 数学 原理 


牛顿 法 迭代 法 (Newton's method ) 又 称 为 牛顿 - 拉 弗 森 方 + 
法 (Newton-Raphson method )， 它 是 一 种 在 实数 域 和 复数 域 上 
近似 求解 方程 的 方法 。 方 法 使 用 函数 Ko 的 泰勒 级 数 的 前 面 几 
项 来 寻找 方程 Ax)=0 的 根 。 


首先 ， 选 择 一 个 接近 函数 x) 零点 的 xo 作 为 近代 初始 值 ， 
计算 相应 的 fxo) 和 切线 斜率 了 xo) (这 里 fx) 是 函数 ft) 的 一 阶 
导 函 数 Ja 然后 我 们 经 过 点 (wo, ftxo)) 做 一 条 斜率 为 了 x0) 的 直线 ， X2 Xl i 
该 直线 与 x 轴 有 一 个 交点 ,可 通过 以 下 方程 的 求解 得 到 这 个 交 en 
二 图 13-1 ”牛顿 迭代 法 允 近 示意 图 
点 的 x 坐标: 


Axo) 


fxo)= (Xo-x) * f (xo) 
求解 这 个 方程 ， 可 以 得 到 ; 
X=Xo 一 xzo (xo) 

我 们 将 新 求 得 的 点 的 x 坐标 命名 为 x1, 通常 如 会 比如 更 接近 方程 fx)=0 的 解 。 因 此 我 们 现在 
可 以 利用 x 开始 下 一 轮 迭 代 。 根 据 上 述 方程 中 x1 和 xo 的 关系 ， 可 以 得 到 一 个 求解 x 的 迭代 公式 : 

Xntl1 一 Xn 一 cn) 人 ‘(xn) 

这 就 是 牛顿 授 代 公式 。 目 前 已 经 证 明 ， 如 果 ftx) 的 一 阶 导 函数 了) 是 连续 函数 ， 并 且 待 求 的 
零点 x 是 孤立 的 , 则 在 零点 x 周围 存在 一 个 区 间 ， 只 要 初始 值 am 位 于 这 个 区 间 ， 和 牛顿 法 迭代 必定 
收敛 。 并 且 ， 只 要 f(x) 关 0， 牛顿 迭代 法 将 具有 平方 收敛 的 性 能 。 这 意味 着 每 迭代 一 次 ， 结 果 的 
有 效 数字 将 增加 一 倍 ， 这 比 二 分 通 近 法 的 线性 收敛 速度 快 了 一 个 数量 级 。 
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13.3 ”用 牛顿 迭代 法 求解 非 线 性 方程 的 实例 


牛顿 迭代 法 原理 简单 , 求 根 收敛 速度 快 , 编制 算法 简单 , 因此 在 计算 机 上 获得 了 广泛 的 应 用 。 
牛顿 迭代 法 和 其 他 迭代 法 一 样 ， 使 用 自 变 量 x 作为 迭代 变量 ,使 用 牛顿 迭代 公式 建立 迭代 关系 ， 
通过 求解 的 精度 控制 迭代 退出 条 件 。 


13.3.1 导 函 数 的 求解 与 近似 公式 


牛顿 迭代 公式 中 需要 计算 函数 的 导数 ， 直接 根 据 原 函数 推出 一 阶 导 函 数 , 然后 计算 导 函 数 的 
值 有 点 困难 , 一 般 都 是 利用 导数 的 数学 原理 , 使 用 近似 公式 直接 求 函数 在 某 一 点 的 导数 。 导 数 的 
数学 定义 是 ， 当 函数 y = ftx) 的 自 变 量 x 在 一 点 z 上 产生 一 个 增 量 Ax 时 ， 函 数 输出 值 的 增 量 Ay 
与 自 变 量 增 量 Ax 的 比值 在 Ax 趋 于 0 时 的 极限 值 。 如 果 这 个 极限 值 存在 ， 则 这 个 值 就 是 fx) 在 xo 
处 的 导数 ， 记 作 了 (xo)。 用 公式 定义 即 为 : 


fo tAW— (Xo) 
了 《二 lim 人 mn = lim A 

极限 是 在 无 穷 小 或 无 穷 大 的 尺度 上 考察 函数 的 一 些 特性 , 在 计算 机 上 无 法 表达 无 穷 小 和 无 穷 
大 ， 只 能 在 数据 能 表达 的 合法 范围 内 , 在 满足 计算 精度 的 情况 下 通过 最 小 值 来 近似 模拟 。 如 果 无 
法 精确 计算 导数 了 'Gxo)， 我 们 仍然 采用 近似 计算 方法 得 到 一 个 满足 精度 的 模拟 值 。 根 据 导数 的 数 
学 定义 ， 如 果 不 考虑 极限 ， 这 个 值 就 是 Ay/Ax 的 值 ， 在 xo 附近 一 个 非常 小 的 尺度 上 选择 A， 可 以 
得 到 近似 的 导数 值 。 我 们 选择 按照 以 下 近似 公式 计算 导数 值 : 
， f(xo +0.000005) f(x, —0.000005) 

f "(m0)= 
0.00001 

计算 函数 /在 x 附近 的 一 阶 导 数值 的 算法 可 定义 为 : 


double CalcDerivative(Functionptr f, double x) 


return (f(x + 0.000005) - f(x - 0.000005)) / 0.00001; 


13.3.2 ”算法 实现 
根据 牛顿 迭代 公式 ， 很 容易 写 出 牛顿 迭代 法 的 算法 实现 : 


double NewtonRaphson(Functionptr f, double x0) 
double x1 = x0 - f(x0) / CalcDerivative(f, x0); 


while(fabs(x1 - x0) > PRECISION) 
t 


x0 = x1; 
x1 = x0 - f(x0) / CalcDerivative(f, x0); 
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return x1; 


} 

参数 wo 是 迭代 初始 值 。 选择 和 13.1.2 节 相 同 的 函数 , 并 将 迭代 初始 值 设置 为 区 间 最 大 值 8.0， 
使 用 牛顿 迭代 法 也 只 需要 7 次 六 代 ,就 可 以 得 到 和 二 分 台 近 法 精度 一 样 的 近似 解 。 选 择 初始 值 -8.0 
从 另 一 个 方向 计算 ， 还 可 以 得 到 另 一 个 解 x = -2.040967365， 计 算 这 个 解 也 只 需要 6 次 迭代 ， 可 
见 牛 顿 迭代 法 的 收敛 速度 是 超 线性 的 。 
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1 子 阐 
计算 儿 何洁 计 算 机 图 形 学 


我 的 专业 是 计算 机 辅助 设计 (CAD ), 算是 一 半 机 械 一 半 软 件 ,《 计 算 机 图 形 学 》 是 必修 课 ， 
也 是 我 最 喜欢 的 课程 。 热 衷 于 用 代码 摆平 一 切 的 我 几乎 将 这 本 教科 书 上 的 每 种 算法 都 实现 了 一 
遍 ， 这 种 重复 劳动 虽然 意义 不 大 , 但 是 收获 很 多 ,特别 是 丢弃 了 多 年 的 数学 又 重新 捡 起 来 了 , 算 
是 最 大 的 收获 吧 。 尽 管 已 经 毕业 多 年 了 ， 但 是 每 次 回顾 这 些 算 法 的 代码 ， 都 觉得 内 心 十 分 滚 涯 。 
如 果 换 成 现在 的 我 ， 铠 怕 再 也 不 会 有 动力 去 做 这 些 事 情 了 。 

在 学 习 《 计 算 机 图 形 学 》 之 前 ， 总 觉得 很 多 东西 高 深 英 测 ,但 实际 掌握 了 之 后 ， 却 发 现 其 中 
并 无 神秘 可 言 ， 就 如 同 被 原始 人 像 神 一 样 崇 拜 的 火 却 被 现代 人 叮 在 嘴 上 玩弄 一 样 的 感觉 。 图 形 学 
的 基础 之 一 就 是 计算 几何 , 但 是 没有 理论 数学 那么 高 深 莫 测 ， 它 很 有 实践 性 ， 有 时 候 甚至 可 以 简 
\。 计 算 几 何 是 随 着 计算 机 和 CAD 的 应 用 而 诞生 的 一 门 新 兴学 科 ， 在 国外 被 称 

“计算 机 辅助 几何 设计 ”( Computer Aided Geometric Design，CAGD )。 本 章 就 来 介绍 一 些 图 形 
> 一 些 图 
形 学 的 知识 和 数学 知识 ， 但 是 都 不 难 。 不 信和 就 来 看 看 吧 。 


14.1 计算 几何 的 基本 算法 


本 节 要 介绍 一 些 图 形 学 常用 的 计算 几何 方法 , 涉及 了 向 量 、 点 线 关系 以 及 点 与 多 边 形 关系 求 
解 等 数学 知识 ,还 有 一 些 平面 几何 的 基本 原理 。 事先 声明 一 下 , 文中 涉及 的 算法 实现 都 出 于 解释 
原理 以 及 揭示 算法 实质 的 目的 。 在 算法 效率 和 可 读 性 二 者 的 考量 上 , 更 注重 可 读 性 ， 有 时 候 为 了 
提高 可 读 性 ， 甚 至 会 刻意 采取 “效率 不 高 ”的 代码 形式 。 在 实际 工程 中 使 用 的 代码 肯定 更 紧凑 ， 
更 高 效 ， 但 是 算法 原理 都 是 一 样 的 ， 请 读者 们 对 此 有 正确 的 认识 。 


14.1.1 点 与 矩形 的 关系 


计算 机 图 形 学 和 数学 到 底 有 什么 关系 ?我 们 先 来 看 几 个 例子 , 增加 一 些 感性 的 认识 。 例如 判 
断 一 个 点 是 否 在 矩 形 内 的 算法 ,就 是 一 个 很 简单 的 算法 , 但 是 却 非常 重要 。 比 如 你 在 一 个 按钮 上 
点 击 鼠 标 , 系统 如 何 知道 你 要 触发 的 是 这 个 按钮 而 不 是 另 一 个 按钮 对 应 的 事件 ? 这 就 是 一 个 点 是 
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和 否 在 矩形 内 的 判断 处 理 。Windows 的 API 提供 了 PtInRect() 函 数 ， 实 现 方法 其 实 就 是 判断 点 的 x 
坐标 和 yy 坐标 是 否 同 时 落 在 矩形 的 x 坐标 范围 和 y 坐标 范围 内 ， 算 法 实现 也 很 简单 : 


bool IsPointInRect(const Rect& rc, const Point& p) 


double xr = (p.x - rc.p1.x) * (p.x - rc.p2.x); 
double yr = (p.y - Tc.p1.y) * (p.y - rc.p2.y); 


, return ( (xr <= 0.0) && (yr <= 0.0) ); 

看 看 IsPointInRect() 也 数 的 实现 是 否 和 你 想象 的 不 一 样 ? 由 于 IspPointInRect() 国 数 并 不 假 
设 和 矩形 的 两 个 定点 是 按照 坐标 轴 升 序 排列 的 ， 所 以 在 算法 实现 时 就 考虑 了 所 有 可 能 的 坐标 范围 。 
有 时 候 硬件 实现 乘法 有 困难 或 受 限制 于 CPU 乘法 指令 的 效率 ， 工 程 上 通常 使 用 一 种 避免 乘法 运 
算 的 算法 , 这 种 算法 虽然 代码 繁琐 了 一 点 , 但 是 非常 高 效 。 我 在 博客 中 介绍 了 这 种 算法 ,读者 可 
通过 我 的 博客 了 解 到 具体 的 算法 实现 。 
spointInRect() 函 数 使 用 的 是 平面 直角 坐标 系 ， 如 果 不 特别 说 明 ,， 本文 所 有 的 算法 都 是 基于 
平面 直角 坐标 系 设计 的 。 男 外 ，IsPointInRect() 函 数 没有 指定 特别 的 浮 点 数 精 度 范围 ， 默 认 是 系 
统 浮 点 数 的 最 大 精度 ， 只 在 某 些 必须 要 与 0 比较 的 情况 下 ， 采 用 107 了 次 方 精 度 ， 如 无 特别 说 明 ， 
本 章 所 有 的 算法 都 这 样 处 理 。 


14.1.2 ”点 与 圆 的 关系 


现在 考虑 复杂 一 点 ， 如 果 图 形 界 面 的 按钮 不 是 矩形 ， 
而 是 圆 形 的 , 该 怎么 办 呢 ? 当然 就 是 判断 点 是 否 在 圆 内 部 。 
判断 算法 的 原理 就 是 计算 点 到 圆心 的 距离 4， 然 后 与 圆 半 
径 了 进行 比较 。 若 &<r， 则 说 明 点 在 圆 内 ， 若 d=r， 则 说 
明 点 在 圆 上 ， 知 d>r， 则 说 明 点 在 圆 外 。 这 就 要 提 到 计算 


ty 


= 


平面 上 两 点 距离 的 算法 。 以 图 14-1 为 例 ， 计算 平 面 上 任意 ” 
两 点 之 间 的 距离 主要 依据 著名 的 色 股 定理 ， 代 码 如 下 : 图 14-1 平 面 两 点 距离 计算 示意 图 


double PointDistance(const Point& p1i, const Point& p2) 


return std::sqrt( (p1.x-p2.x)*(p1.x-p2.x)+ (p1.y-p2.y)*(p1.y-p2.y) ); 
} 


14.1.3 ”矢量 的 基础 知识 


现在 再 考虑 复杂 一 点 ,如 果 按 钮 是 个 不 规则 的 多 边 形 区 域 呢 ? 别 以 为 这 个 考虑 没有 意义 , 很 
多 多 媒体 软件 和 游戏 都 用 各 种 形状 的 不 规则 图 案 作为 热点 ( hot spot )，Windows 也 提供 了 一 个 名 
为 PtInRegion() 的 API， 用 于 判断 点 是 否 在 一 个 不 规则 区 域 中 。 我 们 对 问题 进行 简化 ， 就 是 判断 
一 个 点 是 否 在 多 边 形 内 。 判 断 点 尸 是 否 在 多 边 形 内 是 计算 几何 中 一 个 非常 基本 的 算法 , 最 常用 的 
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方法 是 射线 法 。 以 已 点 为 端点 ， 向 左 方 做 射线 工 ， 然 后 沿 着 工 从 无 穷 远 处 开始 向 已 点 移动 ， 当 遇 
到 多 边 形 的 某 一 条 边 时 ， 记 为 与 多 边 形 的 第 一 个 交点 ， 表 示 进 入 多 边 形 内 部 ， 继 续 移 动 ， 当 遇 到 
男 一 个 交点 时 ， 表示 离开 多 边 形 内 部 。 由 此 可 知 ， 当 工 与 多 边 形 的 交点 个 数 是 偶数 时 ,表示 PP 点 
在 多 边 形 外 ， 当 工 与 多 边 形 交点 个 数 是 奇数 时 ， 表 示 P 点 在 多 边 形 内 部 。 

由 此 可 见 , 要 实现 判断 点 是 否 在 多 边 形 内 的 算法 , 需要 知道 直线 段 求 交 算法 ,而 求 交 算法 又 
涉及 矢量 的 一 些 基 本 概念 ， 因 此 在 实现 这 个 算法 之 前 ， 先 讲 一 下 矢量 的 基本 概念 与 算法 。 

1. 什么 是 矢量 

什么 是 矢量 ? 简单 地 讲 ， 就 是 既 有 大 小 又 有 方向 的 量 , 在 数学 中 又 常 被 称 为 向 量 。 矢 量 有 几 
何 表示 、 人 代数 表 示 和 坐标 表示 等 多 种 表现 形式 ,本 节 讨 论 的 是 几何 表示 。 如 果 一 条 线段 的 端点 是 
有 次 序 之 分 的 ， 我 们 把 这 种 线段 称 为 有 向 线段 ( directed segment )， 比 如 线段 PP, ， 如 果 起 始 端 
点 Pi 就 是 坐标 原点 (0, 0)，P; 的 坐标 是 (x, y)， 则 线段 PP 的 二 维 矢 量 坐 标 表示 就 是 已 = (x,y)。 

2. 矢量 的 加 法 与 减法 

现在 来 看 儿 个 与 矢量 有 关 的 重要 概念 , 首先 是 矢量 的 加 减法 。 假 设 有 二 维 矢 量 P=(xi,y1), 0 
=(x2 ,2)， 则 矢量 加 法 定义 为 : 


P+O= (x+x,y1t+y) (14-1) 
同样 地 ， 矢 量 减法 定义 为 : 
P-0Q0=(x-X ,1 -2) (14-2) 
根据 矢量 加 减法 的 定义 ， 矢 量 的 加 减法 满足 以 下 性 质 : 
P+O=O+P 
P-0=-(0-P) 


图 14-2 展示 了 矢量 加 法 和 减法 的 几何 意义 ， 由 于 几何 中 直线 段 的 两 个 点 不 可 能 刚好 在 原点 ， 
因此 线段 户 P 的 矢量 其 实 就 是 OP, - OP; 的 结果 ， 如 图 14-2b 所 示 。 


人 Pi+tP, ‘ 
[ag 
人 
O b 2 O a Pn 
(a) 矢量 加 法 的 几何 表示 (b) 矢量 减法 的 几何 表示 


图 14-2 矢量 加 法 和 矢量 减法 的 几何 意义 


3. 矢量 的 叉 积 
另 一 个 比较 重要 的 概念 是 矢量 的 又 积 ( 外 积 )。 计算 矢 量 的 又 积 是 判断 直线 和 线段 、 线 段 和 
线段 以 及 线段 和 点 的 位 置 关系 的 核心 算法 。 假 设 有 二 维 矢量 已 = oo，2 = (wz ,加 )， 则 矢量 的 
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P x QO=x1*y2 — xX2*y1 (14-3) 
癌 量 义 积 的 几何 意 a te 
， 而 且 是 个 带 符号 的 面积 ， 由 此 可 知 ， 矢 量 的 又 积 具 有 以 下 性 


PxQ0=-(Q0xP) 

叉 积 的 结果 P x 2 是 已 和 2@ 所 在 平面 的 法 矢量 ， 它 的 方向 是 垂直 与 忆 和 @ 所 在 的 平面 ， 并 
且 按 照 P、O 和 P x 2 的 次 序 构成 右手 系 , 所 以 又 积 的 另 一 个 非常 重要 性 质 是 可 以 通过 它 的 符号 
可 以 判断 两 撩 量 相互 之 间 位 置 关 系 是 顺 时 针 还 是 逆 时 针 关 系 ， 具 体 说 明 如 下 。 

(1) 如 果 P x 0O>0， 则 0O 在 P 的 道 时 针 方 向 ; 

(2) 如 果 P x 0<0， 则 0 在 P 的 顺 时 针 方 向 ; 

(3) 如 果 P x 0=0， 则 0 与 P 共 线 (但 可 能 方向 是 反 的 )。 

给 定向 量 己 = (i,y1)，Q= (Cw,y2)， 计算 又 积 的 算法 实现 为 : 


double Crossproduct(double x1, double y1, double x2, double y2) 
{ 


中 


return x1 * y2 - x2 * y1; 


} 
4. 矢量 的 点 积 


0 


Ps QO=x1*x + yi*y2 (14-4) 
向 量 点 积 的 结果 是 一 个 标量 ， 它 的 代数 表示 是 : 


P: 0=|P||Q| cos(P, 0) (14-5) 

(P, 0) 表示 向 量 己 和 2 的 夹 角 ， 如 果 己 和 0 不 共 线 ， 则 根据 上 式 可 以 得 到 向 量 点 积 的 一 个 

非常 重要 的 性 质 ， 具 体 说 明 如 下 。 

(1) 如 果 P.:O>0, 则 P 和 0 的 夹 角 是 钝 角 (大 于 90 

(2) 如 果 P.O<0, 则 已 和 2 的 夹 角 是 锐角 (小 于 90 
(3) 如 果 P.: 0O=0, 则 P 和 0 的 夹 角 是 90 度 。 

给 定向 量 P= 00，2 = (2,y)， 计算 点 积 的 算法 实现 为 : 


double DotProduct(double x1, double y1, double x2, double y2) 


油 KH 


return x1 * x2 + yl * y2; 


} 
了 解 了 矢量 的 概念 以 及 矢量 的 各 种 运算 的 几何 意义 和 代数 意义 后 , 就 可 以 开始 解决 各 种 计算 
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几何 的 简单 问题 了 ,回想 本 节 开 始 提 到 的 点 与 多 边 形 的 关系 问题 , 首先 要 解决 的 就 是 判断 点 和 直 
线段 的 位 置 关 系 问 题 。 


14.1.4 ”点 与 直线 的 关系 


根据 矢量 又 积 的 几何 意义 ， 如 果 线 段 所 表示 的 矢量 和 点 的 矢量 的 又 积 是 0， 就 说 明 点 在 线段 
所 在 的 直线 上 ， 相 对 于 坐标 原点 0 来 说 ， 线 段 的 矢量 其 实 就 是 线段 终点 P=[pe,)2] 的 矢量 OP, 减 
线段 起 点 Pi=[x, y1] 的 矢量 OP 的 结果 ， 因 此 线段 PiP; 的 矢量 可 以 表示 为 PP, = (wx1, yx-y1)。 
如 果 要 判断 点 书 是 否 在 线段 PP 上 , 就 要 判断 矢量 PP 和 矢量 OP 的 义 积 是 否 是 0。 需 要 注意 的 
是 ， 又 积 为 0 只 能 说 明 点 与 线段 PP 所 在 的 直线 共 线 ， 并 不 能 说 明 点 PP 一 定 会 落 在 PP 区间 
上 ， 因 此 只 是 一 个 必要 条 件 。 要 正确 判断 P 在 线段 P,P, 上 ， 还 需要 做 一 个 排斥 试验 ， 就 是 检查 
点 尸 是 否 在 以 直线 段 为 对 角 线 的 矩形 空间 内 ， 如 果 以 上 两 个 条 件 都 为 真 ， 即 可 判定 点 在 线段 上 。 
有 了 上 述 原理 ,算法 实现 就 比较 简单 了 ， 以 下 就 是 判断 点 是 否 在 线段 上 的 算法 : 


bool IsPointOnLineSegment(const LineSeg& ls, const Point& pt) 


{ 
Rect ITC; 
GetLineSegmentRect(ls, rc); 
double cp = CrossProduct(ls.pe.x - ls.ps.x, ls.pe.y - ls.ps.y, 
pt.x - ls.ps.x, pt.y - ls.ps.y); // 计 算 又 积 
return ( (IsPointInRect(rc，pt)) // 排 除 实验 
&& IsZeroFloatValue(cp) ); //1E-8 精度 
} 


O 


GetLinesegmentRect() 函 数 获 取 直 线 的 矩形 包围 合 ， 为 排斥 试验 做 准备 


14.1.5 ”直线 与 直线 的 关系 


矢量 又 积 计算 在 计算 几何 中 的 另 一 个 用 途 是 直线 段 求 交 。 求 交 算 法 是 计算 机 图 形 学 的 核心 算 
法 ， 也 是 体现 速度 和 稳定 性 的 重要 标志 ， 高 效 并 且 稳定 的 求 交 算 法 是 任何 一 个 CAD 软件 都 必需 
要 重点 关注 的 。 求 交 包 含 两 层 概念 ， 一 个 是 判断 是 否 相 交 ， 另 一 个 是 求 出 交点 。 直 线 〈 段 ) 的 求 
交 算 法 相对 来 说 是 比较 简单 的 ， 首 先 来 看 看 如 何 判断 两 直线 段 是 否 相交 。 

常规 的 代数 计算 通常 分 三 步 , 首先 根据 线段 还 原 出 两 条 线段 所 在 直线 的 方程 ,然后 联 立 方程 
组 求 出 交点 ,最 后 再 判断 交点 是 否 在 线段 区 间 上 。 和 常规 的 代数 方法 非常 繁琐 ,每 次 都 要 解 方程 组 
求 交 点 ,特别 是 交点 不 在 线段 区 间 的 情况 ,计算 交点 就 是 做 无 用 功 。 计 算 几 何方 法 判断 直线 段 是 
否 有 交点 通常 分 两 个 步 又 完成 ， 这 两 个 步骤 分 别 是 快速 排斥 试验 和 跨 立 试验 。 举 个 例子 ,要 判断 
线段 PP 和 线段 212: 是否 有 交点 ， 则 需要 做 以 下 两 个 步 又 。 


(1) 快速 排斥 试验 
设 以 线段 PP 为 对 角 线 的 矩形 为 RI,， 设 以 线段 010; 为 对 角 线 的 矩形 为 尼 ， 如果 Ri 入 


14.1 计算 几何 的 基本 算法 三 195 


不 相交 ， 则 两 线段 不 会 有 交点 。 

(2) 跨 立 试验 

如 果 两 线段 相交 ， 则 两 线段 必然 相互 跨 立 对 方 。 所 谓 跨 立 ,， 指 的 是 一 条 线段 的 两 端点 分 别 位 
于 另 一 线段 所 在 直线 的 两 边 。 判 断 是 否 跨 立 ， 还 是 要 用 到 矢量 又 积 的 几何 意义 。 以 图 14-3 所 示 
内 容 为 例 , 若 Pi1P; 跨 立 010;， ， 则 矢量 (Pi-OD 和 (P-O0D 位 于 矢量 (OO0) 的 两 侧 ， 即 : 


(Pi- QO1) * (0; — O00) * (Py O01) X (O02-01) <0 


上 式 可 改写 成 : 
(Pi- QO1) Xx (O20O1) * (2 -00x(P-0>0 
当 (P1-Q01) x (OO = 0 时 ,说 明 线 段 Pi.P, 和 010; 共 线 (但 是 不 一 定 有 交点 )。 同 理 判 断 
QO10;, 跨 立 Pi1P; 的 依据 是 : 
(Q1-P) xX (Ps—P)* (0;-P)x(P-P)<0 
具体 情况 如 图 14-3 所 示 : 


= 


图 14-3 ”直线 段 跨 立 试验 示意 图 


根据 矢量 又 积 的 几何 意义 ， 跨 立 试验 只 能 证 明 线 段 的 两 端点 位 于 另 一 个 线段 所 在 直线 的 两 
边 , 但 是 不 能 保证 是 在 另 一 直线 段 的 两 端 , 因此 , 跨 立 试验 只 是 证 明 两 条 线段 有 交点 的 必要 条 件 ， 
必需 和 快速 排斥 试验 一 起 才能 组 成 直线 段 相交 的 充分 必要 条 件 。 根 据 以 上 分 析 , 两 条 线段 有 交点 
的 完整 判断 依据 就 是 : 以 两 条 线段 为 对 角 线 的 两 个 矩形 有 交集 ; 两 条 线段 相互 跨 立 。 

判断 直线 段 跨 立 用 计算 又 积 算法 的 CrossProduct() 函 数 即 可 ,还 需要 一 个 判断 两 个 矩形 是 否 
有 交 的 算法 。 和 矩形 求 交 也 是 最 简单 的 求 交 算法 之 一 , 原理 就 是 根据 两 个 矩形 的 最 大 、 最 小 坐标 判 
断 。 所 谓 的 最 大 最 小 坐标 判断 ， 就 是 在 x 坐标 方向 和 yy 坐标 方向 分 别 满足 最 大 值 最 小 值 法 则 ， 简 
单 解释 这 个 法 则 就 是 每 个 矩形 在 每 个 方向 上 的 坐标 最 大 值 都 要 大 于 另 一 个 矩形 在 这 个 坐标 方向 
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上 的 坐标 最 小 值 ， 否则 在 这 个 方向 上 就 不 能 保证 一 定 有 位 置 重 受 。 
否 相交 的 算法 就 可 以 如 下 实现 : 


bool IsRectIntersect(const Rect& rc1, const Rect& rc2) 


{ 


return ( (std::max(rc1.p1.x, rc1.p2.x) >= std::min(rc2.p1.x, rc2.p2.x)) 


由 以 上 分 析 , 判断 两 个 矩形 是 


8& (std::max(Tc2.p1.X，TC2.p2.Xx) >= std::min(rc1.p1.x, rc1.p2.x)) 
&& (std::max(rc1.p1i.y, rc1.p2.y) >= std::min(rc2.p1.y，TC2.p2.y)) 
&& (std::max(rc2.p1i.y, rc2.p2.y) >= std::min(rc1.pi.y, rc1.p2.y)) ); 


} 


完成 了 排斥 试验 和 跨 立 试验 的 算法 ， 最 后 判断 直线 段 是 否 有 交点 的 算法 就 水 到 渠 成 了 : 


bool IslineSegmentIntersect(const LineSeg& 1s1, const LineSeg& 1s2) 


{ 


if(IsLineSegmentExclusive(1sS1，1s2)) // 排 斥 实 验 
{ 


return false; 


//( P1 - 01 ) x( 02 
double pixq = Cross 


//( P2 - 01 ) x( 02 
double p2xq = Cross 


//( 0Q1 - P1 ) x( P2 - 
Product(1s2. 
ls1. 


double qixp = Cross 


//( Q2 - P1 ) x( P2 - 
product(1s2. 
ls1. 


double q2xp = Cross 


// 跨 立 实验 


> 0 ) 


Product(1s1. 
1s2. 


> 4 ) 


Product(1s1. 
1s2. 


P1 ) 


P1 ) 


Ss2. 
SZ 


SZ 


S2 


S1. 
Si 


S1. 


Ss 


return ( (pixq * p2xq <= 0.0) 8& (qixp * q2xp 


ps.x, lsi.ps.y - 1s2. 
ps.x, 1s2.pe.y - 1s2. 


ps.x, lsi.pe.y - 1s2. 
.ps.x, 1s2.pe.y - 1s2. 
ps.x, 1s2.ps.y - 1s1. 


ps.x, lsi.pe.y - 1s1. 


ps.x, 1s2.pe.y - 1s1. 
"bsaXs TST pe,y = .151, 


ps. 
ps. 


ps. 
ps. 
ps. 
ps. 


ps. 
ps. 


IsLinesegmentExclusive() 函 数 就 是 调用 IsRectIntersect() 图 数 根据 结果 做 排斥 判断 ， 此 处 不 


再 列 出 代码 。 


14.1.6 ”点 与 多 边 形 的 关系 


好 了 , 现在 我 们 已 经 了 解 了 矢量 又 积 的 意义 ,以 及 判断 直线 段 是 否 有 交点 的 算法 , 现在 回 过 
头 看 看 文章 开始 部 分 的 讨论 的 问题 : 如 何 判 断 一 个 点 是 否 在 多 边 形 内 部 ?根据 射线 法 的 描述 , 其 
核心 是 求解 从 点 发 出 的 射线 与 多 边 形 的 边 是 否 有 交点 。 注意, 这 里 说 的 是 射线 ， 而 我 们 前 面 讨 
论 的 都 是 线段 , 好 像 不 适用 吧 ? 没 错 , 确实 不 适用 , 但 是 我 要 介绍 一 种 用 计算 机 解决 问题 时 常用 


的 建 模 思想 , 应 用 了 这 种 上 


思想 之 后 ,我 们 前 面 讨论 


的 方法 就 适用 了 。 什 么 思想 呢 ? 就 是 根据 问题 


域 的 规模 和 性 质 抽象 和 简化 模型 的 思想 ， 这 可 不 是 故弄玄虚 ， 说 说 具体 的 思路 吧 。 
计算 机 是 不 能 表示 无 穷 大 和 无 穷 小 , 计算 机 处 理 的 每 一 个 数 都 有 确定 的 值 , 而 且 必须 有 确定 
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的 值 。 我 们 面临 的 问题 域 是 整个 实数 空间 的 坐标 系 , 在 每 个 维度 上 都 是 从 负 无 穷 到 正 无 穷 ， 比 如 
射线 , 就 是 从 坐标 系 中 一 个 明确 的 点 到 无 穷 远 处 的 连 线 。 这 就 有 点 为 难 计算 机 了 ， 为 此 我 们 需要 
简化 问题 的 规模 。 假 设 问题 中 多 边 形 的 每 个 点 的 坐标 都 不 会 超过 (-10000.0,+10000.0) 区 间 ( 比如 
我 们 常见 的 图 形 输出 设备 都 有 大 小 的 限制 )， 我 们 就 可 以 将 问题 域 简化 为 (-10000.0, +10000.0) 区 | 
间 内 的 一 小 块 区 域 ， 对 于 这 块 区 域 来 说 ， 三 10000.0 就 意味 着 无 穷 远 。 你 肯定 已 经 明白 了 ， 数 学 
模型 经 过 简化 后 , 算法 中 提 到 的 射线 就 可 以 理解 为 从 模型 边界 到 内 部 点 了 之 间 的 线段 , 前 面 讨论 
的 关于 线段 的 算法 就 可 以 使 用 了 。 

射线 法 的 基本 原理 是 判断 由 P 点 发 出 的 射线 与 多 边 形 的 交点 个 数 ， 交 点 个 数 是 奇数 表示 P 
点 在 多 边 形 内 (在 多 边 形 的 边 上 也 视 为 在 多 边 形 内 部 的 特殊 情况 )， 正 常情 况 下 经 过 点 P 的 射线 
应 该 如 图 14-4a 所 示 ， 但 是 也 可 能 碰 到 多 种 非 正常 情况 ， 比 如 刚好 经 过 多 边 形 一 个 定点 的 情况 ， 
如 图 14-4b， 这 会 被 误 认 为 和 两 条 边 都 有 交点 ， 还 可 能 与 某 一 条 边 共 线 如 图 14-4c 和 14-4d， 共 线 
就 有 无 穷 多 的 交点 ， 导 致 判断 规则 失效 。 还 要 考虑 凹 多 边 形 的 情况 ， 如 图 14-4e 所 示 。 


人 


( 


EA 
(a) 
| 


(e) 


图 14-4 ”射线 法 可 能 遇 到 的 各 种 交点 情况 

针对 这 些 特殊 情况 ,在 对 多 边 形 的 每 条 边 进行 判断 时 ,要 考虑 以 下 这 些 特殊 情况 , 假设 当前 
处 理 的 边 是 PJ.P,， 则 有 以 下 原则 。 

(1) 如 果 点 己 在 边 P.P;, 上 ， 则 直接 判定 点 已 在 多 边 形 内 ; 

ee 
Pi 或 PP 为 端点 的 其 它 边 时 可 能 已 eR 
标 与 P1、P 中 较 小 的 y 坐 标 相 同 ， 则 忽略 这 个 交点 

a 
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对 于 原则 (3), 需要 判断 两 条 直线 是 否 平 行 , 通常 的 方法 是 计算 两 条 直线 的 斜率 , 但 是 本 算法 
因为 只 涉及 直线 段 ( 射线 也 被 模型 简化 为 长 线段 了 )， 就 简化 了 很 多 ,判断 直线 是 否 水 平 ， 只 要 
比较 一 下 线段 起 始点 的 了 坐标 是 否 相 等 就 行 了 ， 而 判断 直线 是 否 垂直 ,也 只 要 比较 一 下 线段 起 始 
点 的 x 坐标 是 否 相 等 就 行 了 。 

应 用 以 上 原则 后 ， 扫 描 线 法 判断 点 是 否 在 多 边 形 内 的 算法 流程 就 完整 了 ， 图 14-5 就 是 算法 
的 流程 图 。 


ount = 0; 


C 
| 从 P 点 向 左 做 射线 L 


ZL 穿 过 Si 的 端点 


ti 


循环 遍历 多 边 形 的 Si 边 


Count=Count+1;: 


> 


(FEZ ) (CP 在 多 边 形 内 ) 。(《 P 在 多 边 形 外 ) 
图 14-5 判断 点 是 否 在 多 边 形 内 的 扫描 线 算法 流程 


| tr 


有 了 流程 图 做 指导 ,算法 实现 就 水 到 渠 成 了 : 


bool IsPointInPolygon(const Polygon& py, const Point& pt) 


{ 
assert(py.IsValid()); /* 只 考虑 正常 的 多 边 形 */ 


int count = 0; 
LineSeg 1]1 = LineSeg(pt, Point(INFINITE, pt.y)); /# 射 线 L*/ 
for(int i = 0; i < py.GetPolyCount(); i++) 
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{ 
/* 当 前 点 和 下 一 个 点 组 成 线段 PIP2*/ 
LineSeg pp = LineSeg(py.pts[i], py.pts[(i + 1) % py.GetPolyCount()]); 
if(IsPointOnLineSegment (pp, pt)) 
return true; 
} 
if(!pp.IsHorizontal()) 
{ 
if((IsSameFloatValue(pp.ps.y, pt.y)) && (pp.ps.y > pp.pe.y)) 
{ 
Count++; 
} 
else if((IsSameFloatValue(pp.pe.y, pt.y)) 8& (pp.pe.y > pp.ps.y)) 
{ 
Count++; 
} 
else 
if(IsLineSegmentIntersect(pp, 11)) 
{ 
count++; 
} 
} 
} 
} 
return ((count % 2) == 1); 


} 

在 图 形 学 领域 实施 的 真正 工程 代码 , 通常 还 会 增加 一 个 多 边 形 的 外 包 和 矩形 快速 判断 , 对 点 根 
本 就 不 在 多 边 形 周围 的 情况 做 快速 排除 ,提高 算法 效率 。 这 又 涉及 求 多 边 形 外 包 算 形 的 算法 , 这 
个 算法 也 很 简单 ， 就 是 遍历 多 边 形 的 所 有 节点 ， 找 出 各 个 坐标 方向 上 的 最 大 最 小 值 。 在 本 章 的 配 
套 代码 中 有 这 个 算法 的 实现 ， 读 考 也 可 以 自己 完成 这 个 算法 。 

除了 扫描 线 法 , 还 可 以 通过 多 边 形 边 的 法 矢量 方向 、 多 边 形 面积 以 及 角度 和 等 方法 判断 点 与 
多 边 形 的 关系 。 但 是 这 些 算法 要 么 只 文 持 凸 多 边 形 ,要 么 需要 复杂 的 三 角 函 数 运 算 〈 多边形 边 数 
小 于 44 时 ,可 采用 近似 公式 计算 夹 角 和 ， 避 免 三 角 函 数 运算 ), 使 用 的 范围 有 限 ， 只 有 扫描 线 法 
被 广泛 应 用 。 


14.2 ”直线 生成 算法 


在 欧 氏 几何 空间 中 , 平面 方程 就 是 一 个 三 元 一 次 方程 ,直线 就 是 两 个 非 平行 平面 的 交 线 , 所 
以 直线 方程 就 是 两 个 三 元 一 次 方程 组 联 立 。 但 是 在 平面 解析 几何 中 ， 直 线 的 方程 就 简单 得 多 了 。 
平面 几何 中 直线 方程 有 多 种 形式 ,一般 式 直线 方程 可 用 于 描述 所 有 直线 : 


AxtBytC=0 (A、B 不 同时 为 0) (14-6) 
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当知 道 直线 上 一 点 坐标 CXo,7) 和 直线 的 斜率 天 存在 时 ， 可 以 用 点 斜 式 方程 : 


7- 页 =KGCK- 总) (当天 不 存在 时 ， 直 线 方程 简化 成 X= 总) (14-7) 
当知 道 直线 上 的 两 个 点 (X60,H) 和 (1, 六 ) 时 ， 还 可 以 用 两 点 式 方程 描述 直线 : 


了 -yo XXo 

Yi—-Yo Xi—-Xo 

除了 这 三 种 形式 的 直线 方程 外 ,直线 方程 还 有 截 距 式 、 斜 截 式 等 多 种 形式 。 在 计算 机 中 如 何 

展示 直线 图 形 是 计算 机 图 形 学 的 重要 内 容 , 这 就 是 本 节 要 介绍 的 直线 生成 算法 。 要 理解 直线 生成 
算法 ， 首 先 从 理解 光栅 图 形 与 矢量 图 形 的 区 别 ， 来 看 看 什么 是 光栅 图 形 扫描 转换 。 


(14-8) 


2 


14.2.1 什么 是 光栅 图 形 扫描 转换 


在 数学 范畴 内 的 直线 是 由 没有 宽度 的 点 组 成 的 集合 , 但 是 在 计算 机 图 形 学 的 范畴 内 , 所 有 的 
图 形 包括 直线 都 是 输出 或 显示 在 点 阵 设 备 上 的 ， 被 称 为 点 阵 图 形 或 光栅 图 形 。 以 显示 器 为 例 , 现 
实 中 常见 的 显示 器 〈 包 括 CRT 显示 器 和 液晶 显示 器 ) 都 可 以 看 成 由 各 种 颜色 和 灰 度 值 的 像素 点 
组 成 的 像素 矩阵 ， 这 些 点 是 有 大 小 的 ， 而 且 位 置 固定 ， 因 此 只 能 近似 的 显示 各 种 图 形 。 图 14-6 
就 是 对 这 种 情况 的 一 种 念 张 的 放大 。 


MO 


图 14-6 ”直线 在 点 阵 设备 上 的 表现 形式 


计算 机 图 形 学 中 的 直线 生成 算法 ,其实 包 含 了 两 层 意思 , 一 层 是 在 解析 几何 空间 中 根据 坐标 
构造 出 平面 直线 ， 另 一 层 就 是 在 光栅 显示 器 之 类 的 点 阵 设 备 上 输出 一 个 最 逼近 于 图 形 的 像素 直 
线 ， 而 这 就 是 常 说 的 光栅 图 形 扫描 转换 。 本 节 就 介绍 几 种 常见 的 直线 生成 的 光栅 扫描 转换 算法 ， 
包括 数值 微分 法 、Bresenham 算法 、 对 称 直线 生成 算法 以 及 两 步 算法 。 
14.2.2 ”数值 微分 法 


数值 微分 法 (DDA 法 ) 是 直线 生成 算法 中 最 简单 的 一 种 ， 它 是 一 种 单 步 直 线 生 成 算法 。 它 
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的 算法 是 这 样 的 ; 首先 根据 直线 的 斜率 确定 是 以 方向 步 进 还 是 以 了 方向 步 进 ,然后 沿 着 步 进 方 
向 每 步 进 一 个 点 ( 像素 )， 就 沿 着 另 一 个 坐标 方向 步 进 个 点 ,是 直线 的 斜率 ， 不 一 定 是 整数 ， 
需要 在 这 个 坐标 方向 对 步 进 后 的 结果 进行 圆 整 。 
具体 算法 的 实现 ， 除 了 判断 是 按照 艺 方 向 还 是 按照 了 方向 步 进 之 外 ， 还 要 考虑 直线 的 方向 ， 4 
也 就 是 起 点 和 终点 的 关系 。 下 面 就 是 一 个 支持 任意 直线 方向 的 数值 微分 画 线 算法 实例 : 


void DDA Line(int x1, int y1, int x2, int y2) 


{ 


double k,dx,dy,x,y,xend,yend; 


dx = x2 - x1; 


dy = y2 -yd 
if(fabs(dx) >= fabs(dy)) 
{ 
k= dy / dx; 
if(dx > 0) 
X = x1; 
y= y1; 
xend = x2; 
} 
else 
{ 
x = x2; 
y= y2; 
xend = x1; 
} 


while(x <= xend) 


SetDevicepixel((int)x, ROUND INT(y)); 


=y+k; 
X=XxX+1; 
} 
} 
else 
{ 
k= dx / dy; 
if(dy > 0) 
{ 
x = x1; 
= yt; 
yend = y2; 
else 
{ 
x = x2; 
y sy2 
yend = y1; 


while(y <= yend) 
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\ 
SetDevicepixel(ROUND INT(x), (int)y); 
Xx 三 义 十 尿 ; 
y=y+1; 
: 
} 
} 


数值 微分 法 产生 的 直线 比较 精确 ， 而 且 逻 辑 简 单 ， 易 于 用 硬件 实现 ,但 是 步 进 量 x、y 和 
必须 用 浮 点 数 表示 ， 每 一 步 都 要 对 x 或 y 进 行 四 舍 五 人 后 取 整 ， 不 利于 光栅 化 或 点 阵 输 出 。 


14.2.3 ”Bresenham 算法 


Bresenham 算法 是 由 Bresenham 在 1965 年 提出 的 一 种 单 步 直 线 生成 算法 ,是 计算 机 图 形 学 领 
域 使 用 最 广泛 的 直线 扫描 转换 算法 。Bresenham 算法 的 基本 原理 就 是 将 光栅 设备 的 各 行 各 列 像 素 
中 心 连接 起 来 构造 一 组 虚拟 网 格 线 。 按 直线 从 起 点 到 终点 的 顺序 计算 直线 与 各 垂直 方向 网 格 线 的 
交点 ， 然 后 确定 该 列 像素 中 与 此 交点 最 近 的 像素 。 

14-7 就 展示 了 这 样 一 组 网 格 线 ， 每 个 交点 就 代表 点 阵 设 备 上 的 一 个 像素 点 ， 现 在 就 以 图 
14-7 为 例 介绍 一 下 Bresenham 算法 。 当 算法 从 一 个 点 (所 区 沿 着 天 方向 向 前 步 进 到 叱 4 时, 了 方向 
的 下 一 个 位 置 只 可 能 是 和 丈 :; 两 种 情况 ， 到 底 是 了 还 是 Yi 取决 于 它们 与 精确 值 y 的 距离 ql 
和 gq, 哪个 更 小 。 


di=y— 7Y (14-9) 
a (14-10) 


图 14-7 直线 Bresenham 算法 示意 图 


当 qdi-q;>0 时 , 了 方向 的 下 一 个 位 置 将 是 ,1,， 否 则 就 是 六。 由 此 可 见 ，Bresenham 算法 其 
实 和 数值 微分 算法 原理 是 一 样 的 , 差别 在 于 Bresenham 算法 中 确定 了 方向 下 一 个 点 的 位 置 的 判断 
条 件 的 计算 方式 不 一 样 。 现 在 就 来 分 析 一 下 这 个 判断 条 件 的 计算 方法 ,已 知 直线 的 斜率 和 在 y 
轴 的 截 距 bp， 可 推导 出 m1 位置 的 精确 值 y 如 下 : 
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p=kXit+b (14-11) 
将 式 (14-9)、 式 (14-10) 和 式 (14-11) 带 入 qd1-4;， 可 得 到 式 (14-12): 


di d; = 2k Xi Y Yi +2b (14-12) 
又 因为 根据 图 14-7 条 件 , k= dy/dx， 也 1= 下 +1,， 世 1= 天 +1, 将 此 三 个 关系 带 入 式 (14-12)， 
同时 在 等 式 两 边 乘 以 4x， 整理 后 可 得 到 式 (14-13): 
dx(di— d;) =2dyX;+2dy — 2dxY,+ dx(2b — 1) (14-13) 
设 Pi= dx(qdi -qd,), 则 ; 


P;=24dyX; + 2dy — 2dxY; + dx(2b — 1) (14-14) 
因为 图 14-7 的 示例 中 qx 是 大 于 0 的 值 ， 因 此 P; 的 符号 与 (41- 4q;) 一 致 ， 现 在 将 初始 条 件 带 入 
可 得 到 最 初 的 第 一 个 判断 条 件 Pi: 


Pi = 2dy — dx 
根据 X41 与 各 ， 以 及 Ya 与 总 的 关系 ， 可 以 推出 Pi 的 递 推 关 系 : 
PH =P, 让 2dy 5 2dx(yir1 — yi) (14-15) 
由 于 yi 可 能 是 y;， 也 可 能 是 y;+ 1， 因 此 ，Pni 就 可 能 是 以 下 两 种 可 能 ， 并 且 和 yi 的 取 值 是 
对 应 的 : 


Pai=Pi+2dy 【〈 了 方向 保持 原 值 ) (14-16) 
或 
Pai=Pit+2(dy - dx) (7 方向 向 前 步 进 1 ) (14-17) 


根据 上 面 的 推导 ， 当 x >xi， 狐 >y1 时 Bresenham 直线 生成 算法 的 计算 过 程 如 下 。 


(1) 画 点 (cu y1); 计算 误差 初 值 Pi = 2dy - dx; 

(2) 求 直线 的 下 一 点 位 置 : 和 %41 = 乱 + 1， 如 果 P;>0， 则 有 = 下 +1， 和 否则 已 = 也， 
画 点 CC 到; 

(3) 求 下 一 个 误差 Pj,1。 如 果 已 >0， 则 PN = PH+2( =- do0， 否 则 Pj = PH2dy; 

(4) 如 果 没 有 结束 ， 则 转 到 步 又 (2)， 和 否则 结束 算法 。 

下 面 就 给 出 针对 上 面 推导 出 的 算法 源 代码 ( 只 支持 x 三 x1，ys 宇 yi 的 情况 ): 


void Bresenham Line(int x1, int y1, int x2, int y2) 
{ 

int dx = abs(x2 - x1); 

int dy = abs(y2 - y1); 

int p=2*dy- dx; 

1nt x = XL 

int y = yl1; 
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while(x <= x2) 


SetDevicepPixel(x, y); 


上 面 的 代码 只 支持 一 个 方向 的 直线 绘制 , 真正 实用 的 代码 要 支持 各 种 方向 的 直线 生成 , 这 就 
要 考虑 斜率 为 负 值 的 情况 以 及 xi>x; 的 情况 。 要 支持 各 种 方向 的 直线 生成 其 实 也 很 简单 ,就 是 通 
过 坐标 交换 , 使 之 符合 上 面 演示 算法 的 要 求 即 可 。 我 在 博客 中 给 出 了 一 个 实用 的 Bresenham 直线 
生成 算法 ， 读 者 可 通过 我 的 博客 获得 这 个 算法 的 实现 代码 。 

Bresenham 算法 只 实用 整数 计算 ， 少 量 的 乘法 运算 都 可 以 通过 移 位 来 避免 ， 因 此 计算 量 少 ， 


14.2.4 ”对称 直线 生成 算法 


直线 段 有 个 特性 , 那 就 是 直线 段 相 对 于 中 心 点 是 两 边 对 称 的 。 因 此 可 以 利用 这 个 对 称 性 ， 对 
其 他 单 步 直 线 生成 算法 进行 改进 , 使 得 每 进行 一 次 判断 或 相关 计算 可 以 生成 相对 于 直线 中 点 的 两 
个 对 称 点 。 如 此 以 来 ,直线 就 由 两 端 向 中 间 生 成 。 从 理论 上 讲 , 这 个 改进 可 以 应 用 于 任何 一 种 单 
步 直 线 生 成 算法 ， 本 例 就 只 是 对 Bresenham 算法 进行 改进 。 

改进 主要 集中 在 以 下 几 点 ,首先 是 循环 区 间 ， 由 [xi, x2] 修 改 成 [xi, half]，half 是 区 间 [x, xz] 的 
中 点 。 其 次 是 X 轴 的 步 进 方向 改 成 双向 ,最 后 是 了 方向 的 值 要 对 称 修改 , 除 此 之 外 ,算法 整体 结 
构 不 变 ， 下 面 就 是 改进 后 的 代码 : 


void Sym Bresenham Line(int x1, int y1, int x2, int y2) 


int dx,dy,p,const1,const2,xs,ys,xe,ye,half,inc; 


int steep = (abs(y2 - y1) > abs(x2 - x1)) ? 1 : 0; 
if(steep == 1) 
{ 

SwapInt(&x1, &y1); 

SwapInt(&x2, &y2); 


if(x1 > x2) 

{ 
SwapInt(&x1, &x2); 
SwapInt(&y1, &y2); 


dx = x2 - X1; 


dy = abs(y2 - y1); 
p=2*dy- dx; 

const1 = 2 * dy; 

const2 = 2 * (dy - dx); 


xs = x1; 

ys = yl1; 

xe = x2; 

ye = y2; 

half = (dx + 1) 全 2 

inc = (yl < y2) ? 1 : -1; 
while(xs <= Se 

{ 


if(steep == 1) 
{ 


SetDevicepixel(ys, xs); 
SetDevicepixel(ye, xe); 


else 
SetDevicePixel(xs, ys); 
SetDevicepixel(xe, ye); 
} 
XS++; 
Xe--; 
if(p<0) 
p += const1; 
else 
{ 
p += const2; 
ys += inc; 
ye -= inc; 
} 


} 
} 


14.2.5 ”两 步 算法 
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两 步 算法 是 在 生成 直线 的 过 程 中 , 每 次 判断 都 生成 两 个 点 的 直线 生成 算法 。 上 一 节 介 绍 的 对 


称 直 线 生 成 方法 也 是 每 次 生成 两 个 点 ,但 是 它 和 两 步 算 法 的 区 别 就 是 对 称 方法 的 计算 和 判断 是 从 


线段 的 两 端 向 中 点 进行 ， 而 两 步 算法 是 沿 着 一 个 方向 ， 


一 次 生成 两 个 点 o 


当 斜 率 满足 条 件 0<k< 1 时 ,假如 当前 点 P 已 经 确定 ， 如 图 14-8 所 示 ， 则 P 之 后 的 连续 


两 个 点 只 

始 值 是 44y - qx， 其 中 : 
dy =y2—y1 
dx = xX; 一 XI 


可 能 是 四 种 情况 : 4B，A4C，DC 和 DE， 两 步 算 法 设立 决策 量 e 作为 判断 标志 ， 


e 的 初 


为 简单 起 见 ， 先 考虑 dy > dx > 0 这 种 情况 。 当 e>2dx 时 , PP 后 两 个 点 将 会 是 DE 组合 ， 此 时 


e 的 增 量 


t 是 4dy -4dx。 当 qdx<e<24dx 时 , PP 后 的 两 个 点 将 会 是 DC 组 合 


， 此 时 e 的 增 量 是 44y 一 
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2dx。 当 0<e<dx 时 , P 后 的 两 个 点 将 会 是 4C 组 合 ， 此 时 e 的 增 量 是 4dy -2dx。 当 e<0 时 , P 
后 的 两 个 点 将 会 是 4B 组 合 ， 此 时 e 的 增 量 是 4。 综合 以 上 描述 ， 当 斜率 磊 满足 条 件 0<k< 1， 
是 dy > dx >0 这 种 情况 下 ， 两 步 算法 可 以 这 样 实现 .: 


图 14-8 ”直线 两 步 算法 示意 图 


void Double Step Line(int x1, int y1, int x2, int y2) 


{ 


int dx XZ XT: 
int dy = y2 - y1; 


int e = dy*4- dx; 
nt X SxL; 
int y = y1; 


SetDevicepixel(x, y); 


while(x < x2) 
if (e > dx) 
if (e > ( 2 * dx)) 
{ 


e += 4* (dy - dx); 
Xx++; 

y++j 
SetDevicepixel(x, y); 
X++; 

y++; 
SetDevicepixel(x, y); 


else 


e += (4 *dy - 2 * dx); 
x++; 
y++t; 
SetDevicepixel(x, y); 
X++; 
SetDevicepixel(x, y); 
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} 
else 
{ 
if (e > 0) 
{ 
e+= (4* dy -2* dx); 
Xt++; 
SetDevicepixel(x, y); 
X++; 
y++; 
SetDevicepixel(x, y); 
} 
else 
{ 
Xt++; 
SetDevicepixel(x, y); 
X++; 
SetDevicepixel(x, y); 
e+=4*dy; 
. 
} 


} 
} 


以 上 函数 除了 只 支持 一 个 方向 的 直线 生成 之 外 , 还 有 其 他 不 完善 的 地 方 ， 比 如 没有 判断 最 后 
一 个 点 是 否 会 越界 , 大 量 出 现 的 乘法 计算 可 以 用 移 位 处 理 等 。 仿 照 Bresenham 算法 一 节 介绍 的 方 
法 ， 很 容易 将 其 扩展 为 支持 8 个 方向 的 直线 生成 ， 有 兴趣 的 读者 可 自己 研究 实现 算法 。 


14.2.6 ”其 他 直线 生成 算法 


除了 以 上 介绍 的 几 种 直线 生成 算法 ， 还 有 很 多 其 他 直线 光栅 扫描 转换 算法 ， 比 如 三 步 算 法 、 
四 步 算法 、 中 点 划 线 法 等 , 还 有 人 将 三 步 算 法 结合 前 面 介绍 的 对 称 法 提出 了 一 种 可 以 一 次 画 六 个 
点 的 直线 生成 算法 , 这 里 就 不 多 介绍 了 , 有 兴趣 的 读者 可 以 找 计算 机 图 形 学 的 相关 资料 来 了 解 具 
体 的 内 容 。 

在 本 节 介 绍 的 几 种 直线 生成 算法 中 ，DDA 算法 最 简单 ， 但 是 因为 有 多 次 浮 点 数 乘法 和 除法 
运算 , 以 及 浮 点 数 圆 整 运算 , 效率 比较 低 。Bresenham 算法 中 的 整数 乘法 计算 都 可 以 用 移 位 代替 ， 
主要 运算 都 采用 了 整数 加 法 和 减法 运算 ,因此 效率 比较 高 , 各 种 各 样 变 形 的 Bresenham 算法 在 计 
算 机 图 形 软件 中 得 到 了 广泛 的 应 用 。 理 论 上 讲 ， 两 步 算法 以 及 四 步 算 法 效率 应 该 更 高 一 些 , 但 是 
这 两 种 算法 需要 做 比较 多 的 准备 工作 ， 且 多 是 乘法 和 除法 和 运算， 因此 在 生成 比较 短 的 直线 时 , 效 
率 反 而 不 如 Bresenham 算法 。 


14.3 圆 生成 算法 


在 平面 解析 几何 中 ， 圆 的 方程 可 以 描述 为 cc - xo) + 0 - yo) = R ， 其 中 (Ceo, yo) 是 圆心 坐标 ， 
是 圆 的 半径 ， 特 别 的 ， 当 (xo, 7 就 是 坐标 中 心 点 时 ， 圆 方程 可 以 简化 为 过 + 刀 = 尺 。 在 计算 机 
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图 形 学 中 ,加 和 直线 一 样 ,也 存在 点 阵 输出 设备 上 显示 或 输出 的 问题 因此 也 需要 一 套 光栅 扫描 
转换 算法 。 为 了 简化 ,我 们 先 考 虑 圆心 在 原点 的 圆 的 生成 ,对 于 中 心 不 是 原点 的 圆 ， 可 以 通过 坐 
标的 平移 变换 获得 相应 位 置 的 圆 。 


14.3.1 圆 的 八 分 对 称 性 


在 进行 扫描 转换 之 前 ， 需 要 了 解 一 个 圆 的 特性 ， 2 

就 是 圆 的 八 分 对 成 性 。 如 图 14-9 所 示 ， 圆 心 位 于 原点 Fy (0 党 

圆 有 四 条 对 称 轴 x=0、y=0、x=y 和 xx=-， 知 已 
知 圆 弧 上 一 点 PCe,， 妨 ， 就 可 以 得 到 其 关于 四 条 对 称 轴 (用 a 
的 七 个 对 称 点 : (Gx, 一 yp)、(~x,7)、 (x, yp)、G,X)、(9, Xx)、 ey 
(yy,)、(~y, x)， 这 种 性 质 称 为 八 分 对 称 性 。 因 此 只 要 (5% Goay) 
能 画 出 八 分 之 一 的 圆 弧 ， 就 可 以 利用 对 称 性 的 原理 得 
到 整个 圆 。 | 


有 几 种 较 容易 的 方法 可 以 得 到 圆 的 扫描 转换 ， 首 图 14-9 圆 的 八 分 对 称 性 
先 介绍 一 下 直角 坐标 法 。 已 知 圆 方程 : zz + 力 = 及 ， 
若 取 x 作为 自 变量 ， 解 出 y， 得 到 : 


名 7 


ey 


y= VR’ 
在 生成 圆 时 先 扫描 转换 四 分 之 一 的 圆周 ， 让 自 变量 x 从 0 到 R 以 单位 步 长 增加 ， 在 每 一 步 
时 可 解 出 y, 然后 调用 画 点 函数 即 可 逐 点 画 出 圆 。 但 这 样 做 ,由 于 有 乘 方 和 平方 根 运 算 , 并 昌都 
是 浮 点 运算 ,算法 效率 不 高 。 而 且 当 x 接近 R 值 时 (圆心 在 原点 )， 在 圆周 上 的 点 (R, 0) 附 近 ， 
由 于 圆 的 斜率 趋 于 无 穷 大 ， 因 浮 点 数 取 整 需要 四 舍 五 入 的 缘故 ,使 得 圆周 上 有 和 较 大 的 间隙。 接 
下 来 介绍 一 下 极 坐 标 法 , 假设 直角 坐标 系 上 圆 弧 上 一 点 P(x,y) 与 x 轴 的 夹 角 是 9, 则 圆 的 极 坐 标 
方程 为 : 


X 三 RcosO 

y= Rsing 
生成 圆 是 利用 圆 的 八 分 对 称 性 ， 使 自 变量 9 的 取 值 范围 为 Die 
(0,45? ) 就 可 以 画 出 整 圆 .这 个 方法 涉及 三 角 函 数 计算 和 乘法 运算 ， 中 | 一 
计算 量 较 大 。 直 角 坐 标 法 和 极 坐标 法 都 是 效率 不 高 的 算法 ， 因 此 2 
只 是 作为 理论 方法 存在 ， 在 计算 机 图 形 学 中 基本 不 使 用 这 两 种 方 一 一 一 一 -一 
法 生成 圆 。 下 面 就 介绍 几 种 在 计算 机 图 形 学 中 比较 实用 的 圆 的 生 

成 算法 。 

图 14-10 ”中 点 划 线 法 示例 


14.3 圆 生成 算法 号 209 


14.3.2 ”中 点 画 圆 法 


首先 是 中 点 画 圆 法 ， 考 虑 圆心 在 原点 ， 半 径 为 R 的 圆 在 第 一 象限 内 的 八 分 之 一 圆 踊 ， 从 点 
(0, R) 到 点 (R/V2 , R/V2 ) 顺 时 针 方向 确定 这 段 圆 弧 。 假 定 某 点 Pitx 功 已 经 是 该 圆 绝 上 最 接近 实际 
圆 弧 的 点 ,那么 应 的 下 一 个 点 只 可 能 是 正 右 方 的 已 或 右 下 方 的 已 两 者 之 一 ， 如 图 14-10 所 示 。 

构造 判别 函数 : 


FO = +y -RR 
当 F(x,y)= 0 时 ， 表示 点 在 圆 上 ， 当 F(x, y)> 0， 表 示 点 在 圆 外 ， 当 F(x,y)<0 时 ， 表 示 点 在 圆 
内 。 如 果 MM 是 P1 和 PP 的 中 点 ， 则 MY 的 坐标 是 Gj+1,yi; 一 0.5)， 当 FGx+1,y; 一 0.5)<0 时 ,MM 点 在 
圆 内 ,说明 己 点 离 实际 圆 跌 更 近 , 应 该 取 忆 作为 圆 的 下 一 个 点 。 同 理 分 析 ， 当 F(x;+ 1,y;-0.5)> 
0 时 ，P, 离 实际 圆 弧 更 近 ， 应 取 P, 作 为 下 一 个 点 。 当 F(xi+1,yi-0.5)=0 时 ,Pi 和 P, 都 可 以 作为 
圆 的 下 一 个 点 ， 算 法 约定 取 P, 作 为 下 一 个 点 。 
现在 将 MM 点 坐标 (xi; + 1 六 =- 0.5) 带 入 判别 函数 F(x, y)， 得 到 判别 式 a: 
d=F(x+1,y-0.5)= (x+1) + 0.5) -RR 
若 4<0， 则 取 Pi 为 下 一 个 点 ， 此 时 忆 的 下 一 个 点 的 判别 式 为 : 
d’= F(xi+2,y;—0.5)= (x+2) + -0.5) —R 
展开 后 将 d4 带 入 可 得 到 判别 式 的 递 推 关 系 : 
d'’=d+2x;+3 
若 d4>0， 则 取 PP 为 下 一 个 点 ， 此 时 P; 的 下 一 个 点 的 判别 式 为 : 
d’=F(x+2,y—1.5)= +2) + -1.5) -RR 
展开 后 将 d4 带 入 可 得 到 判别 式 的 递 推 关 系 : 
d'=d+20—y)+5 
特别 的 ， 在 第 一 个 象限 的 第 一 个 点 (0, R) 时 ， 可 以 推倒 出 判别 式 4 的 初始 值 qo: 
do=F(1, R-0.5)=1-(R-0.5)Y -R=1.25-R 
根据 上 面 的 分 析 ， 可 以 写 出 中 点 画 圆 法 的 算法 。 考 虑 到 圆心 不 在 原点 的 情况 ， 需 要 对 计算 出 
来 的 坐标 进行 了 平移 ， 下 面 就 是 通用 的 中 点 画 圆 法 的 源 代 码 : 


void MP Circle(int xc , int yc , int r) 


int x, y; 
double d; 
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d=1.25 - I; 
Circleplot(xc , yc ，X , y); 
while(x < y) 


{ 
if(d < 0) 


d=d+2*x+3; 

} 

else 
d=d+2*(x-y)+5; 
y= 

J 

X++; 

Circleplot(xc ，yc ,x , y); 


} 
} 


参数 xc 和 yc 是 圆心 坐标 ,r 是 半径 ，CirclePlot() 孙 数 是 参照 加 的 八 分 对 称 性 完成 八 个 点 的 
位 置 计算 的 辅助 函数 。 


14.3.3 ”改进 的 中 点 画 圆 法 一 一 Bresenham 算法 


中 点 画 圆 法 中 ,计算 判别 式 4 使 用 了 浮 点 运算 , 影响 了 加 的 生成 效率 。 如 果 能 将 判别 式 规约 
到 整数 运算 ， 则 可 以 简化 计算 ， 提 高 效率 。 于 是 人 们 针对 中 点 画 圆 法 进行 了 多 种 改进 ， 其 中 一 种 
方式 是 将 4 的 初始 值 由 1.25 -RR 改 成 1-R, 考虑 到 圆 的 半径 RR 总 是 大 于 2，, 因此 这 个 修改 不 会 影 
响 4d 的 初始 值 的 符号 ,同时 可 以 避免 浮 点 运算 。 还 有 一 种 方法 是 将 4 的 计算 放大 两 倍 ， 同 时 将 初 
始 值 改 成 3 - 2R， 这 样 避免 了 浮 点 运算 ， 乘 二 运算 也 可 以 用 移 位 快速 代替 ,采用 3 - 2R 为 初始 值 
的 改进 算法 ， 又 称 为 Bresenham 算法 : 


void Bresenham Circle(int xc , int yc , int r) 


{ 
int x, y, d; 
X08 
y= 1; 


d=3-2*7r; 
Circleplot(xc , yc ，X , y); 
while(x < y) 


{ 

if(d < 0) 
dd 年 汪 六-63 

} 

else 

{ 
d=d+4*(x-y)+10; 
At 

} 

X++; 


Circleplot(xc ，yc ,x , y); 
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} 
} 


14.3.4” 正 负 判 定 画 圆 法 

除了 中 点 画 圆 算法 ,还 有 一 种 画 贺 算法 也 是 利用 当前 点 产生 的 圆 函 数 进 行 符 号 判别 ， 利 用 
负 反 馈 调 整 以 决定 下 一 个 点 的 产生 来 直接 生成 圆 踊 ， 就 是 正 负 法 ， 下 面 就 介绍 一 下 正 负 法 的 算 
法 实现 。 

正 负 法 根据 圆 函数 : FQ,y)=x +y 一 R 的 值 , 将 平面 区 域 分 成 圆 内 和 圆 外 , 如 图 14-11 所 示 。 
假设 圆 弧 的 生成 方向 是 从 4 到 有 8 方向, 当 某 个 点 Pi 被 确定 以 后 , 已 的 下 一 个 点 Psi 的 取 值 就 根据 
Fi 的 值 进 行 判 定 ， 判 定 的 原则 如 下 。 


口 当 Fw,y) 三 0 时 ; 取 xini=xit1, ya1=yio 即 向 右 走 一 步 , 从 圆 内 走向 圆 外 。 对 应 图 14-11a 
中 的 从 P; 到 Pi,1。 
口 当 Fo 人 >0 时 : 取 xiw=xi, ya1=yi -1。 即 向 下 走 一 步 , 从 圆 外 走向 圆 内 。 对 应 图 14-11b 
中 的 从 已 到 Ps 
4 Pp 
@ 
J 
2 
(a) F(xay) 夺 0， 向 右 走 (b) Fe)>0， 向 下 走 


图 14-11 正 负 法 判定 示意 
由 于 下 一 个 点 的 取向 到 底 是 向 圆 内 走 还 是 向 圆 外 走 取 决 于 Fi, yp 的 正 负 ， 因 此 称 为 正 负 法 。 
对 于 判别 式 FG 站 的 递 推 公式 ， 也 要 分 以 下 两 种 情况 分 别 推算 。 
口 当 F(xi, ye 0 时 ， 也 的 下 一 个 点 Pi 取 Xit1= Xitl, yitl1 一 Ji 判别 式 Ci Ja 的 推算 过 
程 是 : 
Fn= FOt1y) = (tl) ty R= Hy RR) = Fx, DJ)+2xrHl 
口 当 Fx, yp)> 0 时 ， 也 的 下 一 个 点 PH 取 xn Xi, Vir yi— ] ， 判别 式 F(x, Jar) 的 推算 过 


程 是 : 


F(xia, pi)= Fx, yp-1) Xi + 1) R C7 y? R’) 2yit+ 1 = Fx, 2) -2yit1 
设 画 圆 的 初始 点 是 (0, R)， 判 定式 的 初始 值 是 0， 正 负 法 生成 圆 的 算法 如 下 : 


void Pnar Circle(int xc, int yc, int 7) 


int x, y, ff; 


212 b> 第 14 章 计算 几何 与 计算 机 图 形 学 


X=: 0; 
y= 1; 
下 0: 
while(x <= y) 
{ 
Circleplot(xc, yc, x, y); 
1{(F <= 0) 
‘ 
f=f+2*x+1; 
X++; 
} 
else 
{ 


改进 的 中 点 划 线 算法 和 正 负 法 虽然 都 避免 了 浮 点 运算 , 并 且 计算 判别 式 时 用 到 的 乘法 都 是 乘 
2 运算， 可 以 用 移 位 代替 ， 但 是 实际 效率 却 有 很 大 差别 。 因 为 正 负 法 并 不 是 严格 按照 x 方 向 步 进 
的 ,因此 就 会 出 现在 某 个 点 的 下 一 个 点 在 两 个 位 置 上 重复 画 点 的 问题 , 增加 了 不 必要 的 计算 。 此 
外 ， 从 生成 圆 的 质量 看 ， 中 点 画 圆 法 和 改进 的 中 点 画 圆 法 都 比 正 负 法 效果 好 。 


14.4 ”椭圆 生成 算法 


椭圆 和 直线 、 辆 一样， 是 图 形 学 领域 中 的 一 种 常见 图 元 ， 椭 圆 的 生成 算法 ( 光栅 转换 算法 ) 
也 是 图 形 学 软件 中 最 常见 的 生成 算法 之 一 。 在 平面 解析 几何 中 ,椭圆 的 方程 可 以 描述 为 : 


Ee 


(Cr 一) 十 (y—yo) = 证 
a’ pb’ 
其 中 (eo,yo) 是 圆心 坐标 , a 和 45 是 椭圆 的 长 短 轴 ， 特别 的 ， 当 (xo, yo) 就 是 坐标 中 心 点 时 ,椭圆 
方程 可 以 简化 为 : 


全 2 


TL 
a pb’ 
在 计算 机 图 形 学 中 ,椭圆 图 形 也 存在 在 点 阵 输 出 设 ty 
备 上 显示 或 输出 的 问题 ， 因 此 也 需要 一 套 光栅 扫描 转换 本 
算法 。 为 了 简化 ,我们 先 考虑 圆心 在 原点 的 椭圆 的 生成 ， _，/ ee 
对 于 中 心 不 是 原点 的 椭圆 ， 可 以 通过 坐标 的 平移 变换 获 Le 如 


得 相应 位 置 的 椭圆 。 
在 进行 扫描 转换 之 前 , 需要 了 解 一 下 椭圆 的 对 称 性 ， 图 14-12 椭圆 的 对 称 性 
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如 图 14-12 所 示 。 中 心 在 原点 。 焦 点 在 坐标 轴 上 的 标准 椭圆 具有 XX 轴 对 称 、Y 轴 对 称 和 原点 对 称 
特性 ， 已 知 椭圆 上 第 一 象限 的 了 点 坐标 是 (x, y)， 则 椭圆 在 另外 三 个 象限 的 对 称 点 分 别 是 (x, -=p)、 
(x 了 和 (~x, -y)。 因 此 ， 只 要 画 出 第 一 象限 的 四 分 之 一 椭圆 ， 就 可 以 利用 这 三 个 对 称 性 得 到 整个 
椭圆 。 

在 光栅 设备 上 输出 椭圆 有 很 多 种 方法 , 可 以 根据 直角 平面 坐标 方程 直接 求解 点 坐标 , 也 可 以 
利用 极 坐标 方程 求解 ， 但 是 因为 涉及 浮 点 数 取 整 ， 效 果 都 不 好 ， 一 般 都 不 使 用 直接 求解 的 方式 。 
本 文 就 介绍 几 种 计算 机 图 形 学 中 两 种 比较 常用 的 椭圆 生 成 方法 : 中 点 画 椭圆 算法 和 Bresenham 椭 
圆 生成 算法 。 


14.4.1 ”中 点 画 椭圆 法 


中 点 在 坐标 原点 ， 焦 点 在 坐标 轴 上 ( 轴 对 齐 ) 的 椭圆 的 平面 方程 也 可 以 转化 为 如 下 非 参 数 化 
方程 形式 : 


F(x,y)=bx +ay -apb’=0 (14-18) 

无 论 是 中 点 画 线 算 法 、 中 点 画 圆 算法 还 是 本 节 要 介 
绍 的 中 点 画 椭圆 算法 ， 对 选择 x 方向 像素 A 增 量 还 是 y 
方向 像素 A 增 量 都 是 很 敏感 的 。 举 个 例子 ， 如 果 某 段 贺 
弧 上 , x 方向 上 增 量 +1 个 像素 时 ,yy 方向 上 的 增 量 如 果 < 
1， 则 比较 适合 用 中 点 算法 ,如 果 y 方 向 上 的 增 量 >1, 就 


会 产生 一 些 跳 畴 的 点 ,最 后 生成 的 光栅 位 图 圆 弧 会 有 一 些 

突变 的 点 , 看 起 来 好 像 不 在 圆 匆 上 。 因此 , 对 于 中 点 画 圆 

弧 算法 ， 要 区 分 出 椭圆 弧 上 哪 段 Ax 增 量变 化 显著 ， 哪 段 ， 
Ay 增 量变 化 显著 ,然后 区 别 对 待 。 由 于 椭圆 的 对 称 性 ， 14-13 第 一 象限 椭圆 弧 示意 图 


我 们 只 考虑 第 一 象限 的 椭圆 圆 弧 ， 如 图 14-13 所 示 。 
定义 椭圆 弧 上 某 点 的 切线 法 向 量 W 如 下 : 


ee CE C009) 9p +2a2y, 
Ox Oy 
对 方程 (14-18) 分 别 对 x、y 求 偏 导 ， 最 后 得 到 椭圆 弧 PCy) 
上 (Gp) 点 处 的 法 向 量 是 ( 2px, 2a27 )。qy/dx=--1 的 点 是 椭 


圆 弧 上 的 分 界 点 。 此 点 之 上 的 部 分 ( 浅 色 部 分 ) 椭圆 弧 法 
向 量 的 y 分 量 比 较 大 ， 即 22*(x+1)<2a*G -0.5); 此 点 之 
下 的 部 分 ( 深 色 部 分 ) 椭圆 弧 法 向 量 的 x 分 量 比较 大 ， 即 
2p(x +1)>2ay— 0.5), 


对 于 图 14-13 中 浅 色 标 识 的 上 部 区 域 , y 方向 每 变化 


图 14-14 ”中 点 法 对 上 部 区 域 处 理 示 意图 
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1 个 单位 ,x 方向 变化 大 于 一 个 单位 ， 因 此 中 点 算法 需要 沿 着 x 方向 步 进 画 点 ,x 每 次 增 量 加 1， 
求 y 的 值 。 同 理 ， 对 于 图 14-13 中 深 色 标识 的 下 部 区 域 ， 中 点 算法 沿 着 y 方 向 反 向 步 进 , y 每 次 
减 1， 求 x 的 值 。 先 来 讨论 上 部 区 域 椭圆 弧 的 生成 ， 如 图 14-14 所 示 。 假 设 当 前 位 置 是 PGx, y))， 
则 下 一 个 可 能 的 点 就 是 已 点 右边 的 PiGxitl1, 有 点 或 右 下 方 的 Pxit1, =-D 上 点， 取舍 的 方法 取决 于 
判别 式 4;，4i 的 定义 如 下 : 
di;= F(xit1, yi— 0.5)= bxt1) + ay— 0.5) ~ ap? 
若 d;<0， 表 示 像 素 点 Pl 和 P, 的 中 点 在 椭圆 内 ， 这 时 可 取 忆 为 下 一 个 像素 点 。 此 时 za =xi+ 1， 
yitl i, 代入 判别 式 d; 得 到 dil: 
di = F(xitl, pi— 0.5) = D(xt2) + ayi— 0.5Y ~ ap’ = qd;+ b’(2x;+ 3) 
计算 出 ;的 增 量 是 (2x;+3)。 同 理 , 若 4; = 0， 表示 像素 点 Pl 和 忆 的 中 点 在 椭圆 外 ， 这 时 应 当 
取 P 为 下 一 个 像素 点 。 此 时 Xir1 =Xit+ 1, yitl1 yi — 1, 代入 判别 式 d; 得 到 dii: 
di = Faitl, pi — 0.5) = bxt2) + ay;—1.5) ~ ab’ = di + b"(2xt3) + a( — 2yi+2) 

计算 出 qi; 的 增 量 是 户 (2x+3)ta(-2y+2)。 计 算 di 的 增 量 Po 
的 目的 是 减少 计算 量 ， 提 高 算法 效率 ， 每 次 判断 一 个 点 
时 ， 不 必 完 整 的 计算 判别 式 d;， 只 需 在 上 一 次 计算 出 的 
判别 式 上 增加 一 个 增 量 即 可 。 

接 下 来 看 看 下 部 区 域 椭圆 弧 的 生成 ,如 图 14-15 所 示 。 


假设 当前 位 置 是 PG yi)， 则 下 一 个 可 能 的 点 就 是 了 点 左 
下 方 的 Pi 一 1,y; 一 1) 点 或 下 方 的 P(xi, Ji 一 IJ) 点 ， 取舍 的 方 
法 同样 取决 于 判别 式 d;，4d 的 定义 如 下 : 图 14-15 中 点 法 对 下 部 区 域 处 理 示意图 


d;= F(xit0.5, y—1) = b*(xi+0.5) + aq;—1) -ap 
若 di:<0， 表 示 像 素 点 Pi 和 P; 的 中 点 在 椭圆 内 ， 这 时 可 有 取 P, 为 下 一 个 像素 点 。 此 时 za =xi+1， 
yil=yi— 1, 代入 判别 式 d; 得 到 dl: 
da1 = Fx.1+0.5, pi-1) = bxit1.5)Y + a 2) ab’ = qd;+ b"(2xit2)ta"(—2y+3) 
计算 出 4 的 增 量 是 户 (2x+2)ta(-2yi+3)。 同 理 , 车 di 二 0， 表示 像素 点 P1 和 P, 的 中 点 在 椭圆 外 ， 
这 时 应 当 取 Pi 为 下 一 个 像素 点 。 此 时 xa =xi，yi4=yi 一 1， 代 入 判别 式 qj 得 到 qj: 
di1 = F(xint0.5, TD b’(xit0.5) | a 2) abp” = qd, | 0 2yi+3) 

计算 出 di 的 增 量 是 a (—2y+3)。 

中 点 画 椭圆 算法 从 (0, 5) 点 开始 ， 第 一 个 中 点 是 (1,5 一 0.5)， 判 别 式 4 的 初始 值 是 : 

do=F(1,b—0.5)= b+a(-b+0.25) 

上 部 区 域 生 成 算法 的 循环 终止 条 件 是 : 2b”(x + 1) 三 2a*Cy -0.5)， 下 部 区 域 的 循环 终止 条 件 是 y= 
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0， 至 此 ， 中 点 画 椭圆 算法 就 可 以 完整 给 出 了 : 


void MP_Ellipse(int xc , int yc , int a, int b) 


double sqa 
double sqb 


a* a; 
bbs 


double d = sqb + sqa * (-b + 0.25); 
int x = 0; 
int y = b; 
Ellipseplot(xc, yc, x, y); 
while( sqb * (x + 1) < sqa * (y - 0.5)) 
{ 
if (d < 0) 


d+= sqb * (2 * x + 3); 
} 
else 
{ 
d+= (sqb * (2* x+3)+sqa* (-2* y+ 2)); 
y--; 


} 

X++; 

EllipsePlot(xc, yc, x, y); 
} 
d= (b* (x+0.5))* 2+ (a*(y-1))*2- (a*b)*2; 
while(y > 0) 


{ 

if (d < 0) 
d+= sqdb * (2* x+2)+ sqa* (-2* y+ 3); 
X++; 

else 

{ 
d+= sqa * (-2 * y + 3); 

} 

y- 


EllipsePlot(xc, yc, x, y); 
} 
} 


EllipsePlot() 函 数 利用 椭圆 的 三 个 对 称 性 ， 一 次 完成 四 个 对 称 点 的 绘制 ， 因 为 简单 ， 此 处 就 
不 再 列 出 代码 。 


14.4.2 ”Bresenham 椭圆 算 ; 


中 点 画 椭圆 法 中 ， 计 算 判 别 式 4 使 用 了 浮 点 运算 , 影响 了 椭圆 的 生成 效率 。 如 果 能 将 判别 式 
规约 到 整数 运算 ， 则 可 以 简化 计算 ,提高 效率 。 于 是 人 们 针对 中 点 画 椭圆 法 进行 了 多 种 改进 ， 提 
出 了 很 多 种 中 点 生成 椭圆 的 整数 型 算法 ，Bresenham 椭圆 生成 算法 就 是 其 中 之 一 。 
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在 生成 椭 加 上 部 区 域 时 ， 以 x 轴 为 步 进 方向 ， 如 图 14-16a 所 示 ， 当 x 步 进 到 x+1 时 , 需要 判 
断 y 的 值 是 保持 不 变 还 是 步 进 到 y-1，Bresenham 算法 定义 判别 式 为 : 


P(x,y) X+1 x X+1 
了 1 人 下 y 
| 
dl 
y—1 人 y—1 
P; 
(a) 


图 14-16 ”Bresenham 椭圆 生成 算法 判别 式 


D= di 二 0 
如 果 <0， 则 取 Pi 为 下 一 个 点 , 否则 , 取 Py 为 下 一 个 点 。 采 用 判别 式 D， 避免 了 中 点 算法 
y-0.5 而 引入 的 浮 点 运算 ， 使 得 判别 式 规约 为 全 整数 运算 ， 算 法 效率 得 到 了 很 大 的 提升 。 根 据 
椭圆 方程 ， 可 以 计算 出 qi 和 qs 分 别 是 : 


di=a bi —y) 
d= OO 过 JarD) 
以 (0, 5) 作 为 椭圆 上 部 区 域 的 起 点 ， 将 其 代入 判别 式 D 可 以 得 到 如 下 递 推 关系 : 
Di = D;+ 2b’(2x;+3)(D;<0) 
Di1=D;+ 2b’(2x;+3)— 4a 1) (D;= 0) 
Do=2b’ -2ab+a 


在 生成 椭圆 下 部 区 域 时 ， 以 y 轴 为 步 进 方 向 ， 如 图 14-16b 所 示 ， 当 ? 步 进 到 y-1 时 , 需要 判 
断 x 的 值 是 保持 不 变 还 是 步 进 到 x+1， 对 于 下 部 区 域 , 计算 出 qi 和 4 分别 是 : 


di = bxar = x ) 
ds= bx — x7) 
以 (Gv, yy) 作 为 椭圆 下 部 区 域 的 起 点 ， 将 其 代入 判别 式 D 可 以 得 到 如 下 递 推 关 系 : 


Di=D;- 4ay;— 1)+20 (D;<0) 


Dia=Dit2b Gt) -4a0-D)+2a+b (Di>0) 


Do= D(x + 1) tox -2ab +2a0,— 1) 
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根据 以 上 分 析 ，Bresenham 椭圆 生成 算法 的 实现 就 比较 简单 了 : 


b) 


void Bresenham Ellipse(int xc , int yc , int a, int 
nt sqa = a* a; 
nt sqb = b*b; 
it :OF 
nt y = b; 
int d=2* sqgp-2*Db* sqa+ sqa; 
Ellipseplot(xc, yc, x, y); 
int P x = ROUND_INT( (double)sqa/sqrt((double)(sqa+sqb)) ); 


while(x <= P_x) 
if(d < 0) 


d+= 2* sqb * (2 * x + 3); 

} 

else 

{ 
d+=2* sqp* (2*x+3)-4*sqa*( 
y--; 

} 

X++; 

EllipsePlot(xc, yc, x, y); 

} 


d= sq * (x*x+xX)+sqa*(y*y-y)- sqa 
while(y >= 0) 


{ 
EllipsePlot(xc, yc, x, y); 
y--; 
if(d < 0) 
{ 
X++; 
d=d-2*sqa*y-sqat+2*sq*x 
} 
else 
{ 
d=d-2* sqa*y- sqa; 
} 
} 


} 
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= 


* sqb; 


+ 2* sqb; 


平面 区 域 填充 算法 是 计算 机 图 形 学 领域 的 一 个 很 重要 的 算法 , 区 域 填充 即 给 出 一 个 区 域 的 边 


界 (也 可 以 是 没有 边界 ， 只 是 给 出 指定 颜色 )， 要 求 ; 


各 边界 范围 内 的 所 有 像素 单元 都 修改 成 指定 


的 颜色 ( 也 可 能 是 图 案 填 充 )。 区 域 填充 中 最 常用 的 是 多 边 形 填 色 ， 本 闻 我 们 就 讨论 几 种 多 边 形 


区 域 填 充 算 法 。 


218 b> 第 14 章 计算 几何 与 计算 机 图 形 学 


14.5.1 ”种子 填充 算法 


如 果 要 填充 的 区 域 是 以 图 像 元 数据 方式 给 出 的 ， 通 党 使 用 种 子 填充 算法 进行 区 域 填 充 。 种 子 
填充 算法 需要 给 出 图 像 数 据 的 区 域 , 以 及 区 域内 的 一 个 点 , 这 种 算法 比较 适合 人 机 交互 方式 进行 的 
图 像 填充 操作 , 不 适合 计算 机 自动 处 理 和 判断 填 色 。 根据 对 图 像 区域 边 界定 义 方式 以 及 对 点 的 颜色 
修改 方式 , 种 子 填充 又 可 细 分 为 几 类 ， 比 如 注入 填充 算法 、 边 界 填充 算法 以 及 为 减少 递归 和 压 栈 次 
数 而 改进 的 扫描 线 种 子 填充 算法 等 。 

所 有 种 子 填充 算法 的 核心 其 实 就 是 一 个 递归 算法 , 都 是 从 指定 的 种 子 点 开始 , 向 各 个 方向 上 
搜索 , 逐个 像素 进行 处 理 ， 直 到 遇 到 边界 ,各 种 种 子 填充 算法 只 是 在 处 理 颜 色 和 边界 的 方式 上 有 
所 不 同 。 在 开始 介绍 种 子 填充 算法 之 前 ， 首 先 也 介绍 两 个 概念 ， 就 是 “4- 联 通 算法 ”和 “8- 联 通 
算法 "。 既 然 是 搜索 就 涉及 搜索 的 方向 问题 ， 从 区 域内 任意 一 点 出 发 ， 如 果 只 是 通过 上 、 下 、 左 、 
右 四 个 方向 搜索 到 达 区 域内 的 任意 像素 , 则 用 这 种 方法 填充 的 区 域 就 称 为 四 连通 域 , 这 种 填充 方 
法 就 称 为 4- 联 通 算法 。 如 果 从 区 域内 任意 一 点 出 i 
发 ; 通过 上 、 下 、 大、 有 十 上 左下、 有 上 和 和 帮 | , 
下 全 部 八 个 方向 到 达 区 域内 的 任意 像素 , 则 这 种 方 | | 
法 填充 的 区 域 就 称 为 入 连通 域 , 这 种 填充 方法 就 称 
为 8- 联 通 算法 。 如 图 14-17a 所 示 ， 假 设 中 心 的 深 SPO8 8088 
灰色 点 是 当前 处 理 的 点 ,如 果 是 4 联通 算法 , 则 只 e2 全 
搜索 处 理 周围 深 灰 色 标 识 的 四 个 点 ; 如 果 是 8- 联通 @@@@@ 
算法 则 除了 处 理 上 、 下 、 左 、 右 四 个 深 灰 色 标识 的 。 全 28 
点 , 还 搜索 处 理 四 个 浅 灰 色 标识 的 点 , 假如 都 是 人 @@C@@ 
白色 点 开始 填充 , 两 种 搜索 算法 的 填充 效果 分 别 如 四 © 
图 14-17b 和 图 14-17c 所 示 。 图 14-17 “4- 联 通 ” 和 “8- 联 通 ” 填 充 效 果 图 

1. 注入 填充 算法 (Flood Fill Algorithm) 

注入 填充 算法 不 特别 强调 区 域 的 边界 , 它 只 是 从 指定 位 置 开 始 , 将 所 有 联通 区 域内 某 种 指定 
颜色 的 点 都 蔡 换 成 另 一 种 颜色 , 从 而 实现 填充 效果 。 注 入 填充 算法 能 够 实现 颜色 替换 之 类 的 功能 ， 
这 在 图 像 处 理 软件 中 都 得 到 了 广泛 的 应 用 ,注入 填充 算法 的 实现 非常 简单 ,核心 就 是 递归 和 搜索 ， 
以 下 就 是 注入 填充 算法 的 一 个 实现 : 


void FloodSeedFill(int x, int y, int old color, int new color) 


{ 


Ill 


1 


if(GetPixelColor(x，y) == old color) 
{ 


SetPixelColor(x, y, new color); 
for(int i = 0; i < COUNT OF(direction 8); i++) 


FloodSeedFill(x + direction 8[i].x offset, 
y + direction 8[il].y offset, old color, new color); 
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} 
for 循环 实现 了 向 8 个 联通 方向 的 递归 搜索 ， 秘 密 就 在 于 direction 8 的 定义 : 
typedef struct tagDIRECTION 

int x offset; 


int y offset; 
}DIRECTION; 


DIRECTION direction 8[] = { {-1, 0}, {-1, 1}, {0, 1}, {1, 1}, {1, 0}, {1, -1}, {0, -1}, {-1, -1} }; 

这 个 是 搜索 类 算法 中 常用 的 技巧 , 在 本 书 第 1 章 已 经 提 到 过 类 似 的 方法 。 只 要 将 其 替换 成 如 
下 direction 4 的 定义 ， 就 可 以 将 算法 改 成 4 个 联通 方向 填充 算法 : 

DIRECTION direction 4[] = { {-1, 0}, {0, 1}, {1, 0}, {0, -1} }; 

2. 边界 填充 算法 

边界 填充 算法 与 注入 填充 算法 的 本 质 其 实 是 一 样 的 , 都 是 递归 和 搜索 , 区 别 只 在 于 对 边界 的 
确认 , 也 就 是 递归 的 结束 条 件 不 一 样 。 注 入 填充 算法 没有 边界 的 概念 ， 只 是 对 联通 区 域内 指定 的 
颜色 进行 赫 换 ， 而 边界 填充 算法 恰恰 强调 边界 的 存在 ， 只 要 是 边界 内 的 点 无 论 是 什么 颜色 ,都 蔡 
换 成 指定 的 颜色 。 边 界 填充 算法 的 应 用 也 非常 广泛 , 画图 软件 中 的 “油漆 桶 ”功能 就 是 边界 填充 
算法 的 例子 。 以 下 就 是 边界 填充 算法 的 一 个 实现 。 


void BoundarySeedFill(int x, int y, int new color, int boundary_color) 


上 
int curColor = GetPixelColor(x, y); 
if( (curColor != boundary color) 
&& (curColor != new color) ) 


{ 
SetPixelColor(x, y, new color); 
for(int i = 0; i < COUNT OF(direction 8); i++) 
BoundarySeedFill(x + direction 8[i].x offset, 
y + direction 8[il].y offset, new color, boundary color); 
} 
} 


} 

3. 扫描 线 种 子 填充 算法 

前 面 介绍 的 两 种 种 子 填 充 算法 的 优点 是 非常 简单 , 缺点 是 使 用 了 递归 算法 , 这 不 但 需要 大 量 栈 
空间 来 存储 相 邻 的 点 ,而且 效率 不 高 。 为 了 减少 算法 中 的 递归 调用 ,节省 栈 空间 的 使 用 ， 人 们 提出 
了 很 多 改进 算法 ， 其 中 一 种 就 是 扫描 线 种 子 填充 算法 。 该 算法 不 再 采用 递归 的 方式 处 理 4- 联 通 和 
8- 联 通 的 相 邻 点 , 而 是 通过 沿 水 平 扫描 线 填 充 像素 段 ,一 段 一 段 地 来 处 理 4- 联 通 和 8- 联 通 的 相 邻 点 。 
这 样 算 法 处 理 过程 中 就 只 需要 将 每 个 水 平 像素 段 的 起 始点 位 置 压 人 一 个 特殊 的 栈 , 而 不 需要 象 递归 
算法 那样 将 当前 位 置 周围 尚未 处 理 的 所 有 相 邻 点 都 压 人 堆栈 , 从 而 可 以 节省 堆栈 空间 。 应 该 说 , 扫 
描 线 填 充 算法 只 是 一 种 避免 递归 , 提高 效率 的 思想 , 前 面 提 到 的 注入 填充 算法 和 边界 填充 算法 都 可 
以 改进 成 扫描 线 填充 算法 ， 下 面 介绍 的 就 是 结合 了 边界 填充 算法 的 扫描 线 种 子 填充 算法 。 
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扫描 线 种 子 填 充 算法 的 基本 过 程 如 下 : 当 给 定 种 子 点 (x, 时 , 首先 分 别 向 左 和 向 右 两 个 方向 
填充 种 子 点 所 在 扫描 线 上 的 位 于 给 定 区 域 的 一 个 区 段 ， 同 时 记 下 这 个 区 段 的 范围 [xLeft, xRight]， 
然后 确定 与 这 一 区 段 相连 通 的 上 、 下 两 条 扫描 线 上 位 于 给 定 区 域内 的 区 段 ,并 依次 保存 下 来 。 反 
复 这 个 过 程 ， 直 到 填充 结束 。 扫 描 线 种 子 填 充 算 法 可 由 下 列 四 个 步 又 实现 。 


(1) 初始 化 一 个 空 的 栈 用 于 存放 种 子 点 ， 将 种 子 点 (x, 力 人 栈 ; 

(2) 判断 栈 是 否 为 空 ， 如 果 栈 为 空 则 结束 算法 ， 否 则 取出 栈 顶 元 素 作 为 当前 扫描 线 的 种 子 点 
(x, y), y 是 当前 的 扫描 线 ; 

(3) 从 种 子 点 (x, 力 出 发 ， 沿 当前 扫描 线 向 左 、 右 两 个 方向 填充 ， 直 到 边界 。 分 别 标记 区 有 段 的 
左 、 右 端点 坐标 为 xLeft 和 xRight; 

(4) 分 别 检 查 与 当前 扫描 线 相 邻 的 y -= 1 和 y+ 1 两 条 扫描 线 在 区 间 [xLeft, xRight] 中 的 像素 ， 
从 xLeft 开始 向 xzRight 方 向 搜索 ， 若 存在 非 边界 且 未 填充 的 像素 点 ， 则 找 出 这 些 相 邻 的 像素 点 中 
最 右边 的 一 个 ， 并 将 其 作为 种 子 点 压 人 栈 中 ， 然 后 返回 第 (2) 步 ; 

这 个 算法 中 最 关键 的 是 第 (4) 步 ,就 是 从 当前 扫描 线 的 上 一 条 扫描 线 和 下 一 条 扫描 线 中 寻找 新 
的 种 子 点 。 这 里 比较 难 理解 的 一 点 就 是 为 什么 只 是 检查 新 扫描 线 上 区 间 [xLeft, xRight] 中 的 像素 ? 
如 果 新 扫描 线 的 实际 范围 比 这 个 区 间 大 ( 而 且 不 连续 ) 怎么 处 理 ? 我 查 了 很 多 计算 机 图 形 学 的 书 
和 论文 ,好 像 都 没有 对 此 做 过 特殊 说 明 , 这 使 得 很 多 人 在 学 习 这 门 课程 时 对 此 有 挥 之 不 去 的 疑惑 。 
本 着 “ 般 人 ”不 倦 的 思想 ， 我 们 就 哆 味 解 释 一 下 ， 希 望 能 解除 大 家 的 疑惑 。 

如 果 新 扫描 线 上 实际 点 的 区 间 比 当前 扫描 线 的 [xLeft, xRight] 区 间 大 ， 而 且 是 连续 的 情况 下 ， 
算法 的 第 (3) 步 就 处 理 了 这 种 情况 。 如 图 14-18 所 示 ， 假设 当 前 处 理 的 扫描 线 是 白色 点 所 在 的 第 7 
行 ， 则 经 过 第 (3) 步 处 理 后 可 以 得 到 一 个 区 间 [6,10]。 然 后 第 4 步 操作 ， 从 相 邻 的 第 6 行 和 第 8 行 
两 条 扫描 线 的 第 6 列 开 始 向 右 搜索 , 确定 浅 灰 色 的 两 个 点 分 别 是 第 6 行 和 第 8 行 的 种 子 点 ， 于 是 
按照 顺序 将 (6, 10) 和 (8, 10) 两 个 种 子 点 人 栈 。 接 下 来 的 循环 会 处 理 (8, 10) 这 个 种 子 点 ,根据 算法 第 
(3) 步 说 明 ， 会 从 (8, 10) 开 始 向 左 和 向 右 填充 ， 由 于 中 间 没 有 边界 点 ， 因 此 填充 会 直到 直到 边界 为 


止 ， 所 以 尽管 第 8 行 实际 区 域 比 第 7 行 的 区 间 [6,10] 大 ,但 是 仍然 得 到 了 正确 的 填充 。 
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图 14-18 ”新 扫描 线 区 间 增 大 且 连 续 的 情况 
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如 果 新 扫描 线 上 实际 点 的 区 间 比 当前 扫描 线 的 [xLeft, xRight] 区 间 大 ， 而 且 中 间 有 边界 点 的 情 
况 , 算法 又 是 怎么 处 理 呢 ? 算法 描述 中 虽然 没有 明确 对 这 种 情况 的 处 理 方法 , 但 是 第 (4) 步 确定 上 、 
下 相 邻 扫描 线 的 种 子 点 的 方法 ， 以 及 靠 右 取 点 的 原则 ， 实 际 上 暗含 了 从 相 邻 扫描 线 绕 过 障碍 点 的 
方法 。 下 面 以 图 14-19 为 例 说 明 ， 算 法 第 (3) 步 处 理 完 第 5 行 后 ,确定 了 区 间 [7, 9]， 相 邻 的 第 4 行 
虽然 实际 范围 比 区 间 [7, 9] 大 , 但 是 因为 被 (4, 6) 这 个 边界 点 阻碍 ， 使 得 在 确定 种 子 点 (4, 9) 后 向 左 填 
充 只 能 填充 右边 的 第 7 列 到 第 10 列 之 间 的 区 域 ， 而 左边 的 第 3 列 到 第 5 列 之 间 的 区 域 没 有 填充 。 
虽然 作为 第 5 行 的 相 邻 行 ， 第 一 次 对 第 4 行 的 扫描 根据 靠 右 原则 只 确定 了 (4, 9) 一 个 种 子 点 。 但 是 
对 第 3 行 处 理 完 后 ， 第 4 行 的 左边 部 分 作为 第 3 行 下 边 的 相 邻 行 ， 再 次 得 到 扫描 的 机 会 。 第 3 行 
的 区 间 是 [3, 9]， 向 左 跨 过 了 第 6 列 这 个 障碍 点 ， 第 2 次 扫描 第 4 行 的 时 候 就 从 第 3 列 开 始 ， 向 右 
找 ， 可 以 确定 种 子 点 (4 5)。 这 样 第 4 行 就 有 了 两 个 种 子 点 ， 就 可 以 被 完整 地 填充 了 。 
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图 14-19 ”新 扫描 线 区 间 增 大 且 不 连续 的 情况 
由 此 可 见 , 对 于 有 障碍 点 的 行 , 通过 相 邻 边 的 关系 ， 可 以 跨越 障碍 点 ,通过 多 次 扫描 得 到 完 
整 的 填充 , 算法 已 经 隐 含 了 对 这 种 情况 的 处 理 。 根 据 本 节 总 结 的 四 个 步骤 ,扫描 线 种 子 填 充 算法 
的 实现 如 下 : 


void ScanLineSeedFill(int x, int y, int new color, int boundary color) 


{ 


Il 


‘OP AA OW 上 wm 一 


jo 


std::stack<POINT> stk; 


stk.push(POINT(x,，y)); // 第 1 步 ， 种子 点 入 站 
while(!stk.empty()) 
{ 
POINT seed = stk.top(); // 第 2 步 ， 取 当前 种 子 点 
stk.pop(); 


// 第 3 步 ， 向 左右 填充 

int count = FillLineRight(seed.X，seed.y，new color，boundary_color);// 向 右 填 充 
int xRight = seed.x + count - 1; 

count = FillLineLeft(seed.x - 1，seed.y，new_ color，boundary_color);// 向 左 填充 
int xLeft = seed.x - count; 


// 第 4 步 ， 处 理 相 邻 两 条 扫描 线 
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SearchLineNewSeed(stk, xLeft, xRight, seed.y - 1, new color, boundary color); 
SearchLineNewSeed(stk, xLeft, xRight, seed.y + 1, new color, boundary color); 


} 
} 


FillLineRight() 和 FillLineLeft() 两 个 函数 就 是 从 种 子 点 分 别 向 右 和 向 左 填充 颜色 , 直到 遇 到 


边界 点 , 同时 返回 填充 的 点 的 个 数 。 这 两 个 函数 返回 填充 点 的 个 数 是 为 了 正确 调整 当前 种 子 点 所 
在 的 扫描 线 的 区 间 [xLeft, xRight]。SearchLineNewSeed() 销 数 完成 算法 第 (4) 步 所 描述 的 操作 ,就 是 
在 新 扫描 线 上 寻找 种 子 点 ， 并 将 种 子 点 和 人 栈 ， 新 扫描 线 的 区 间 是 xLeft 和 xRight 参数 确定 的 : 


void SearchLineNewSeed(std::stack<POINT>& stk, int xLeft, int xRight, 
int y, int new color, int boundary color) 


{ 
int xt = xLeft; 
bool findNewSeed = false; 


while(xt <= xRight) 
{ 
findNewSeed = false; 
while(IsPixelValid(xt, y, new color, boundary color) && (xt < xRight)) 


findNewSeed = true; 
Xt++; 


if(findNewSeed) 
{ 


if(IspixelValid(xt, y, new color, boundary color) 8&& (xt == xRight)) 
stk.push(POINT(xt, y)); 
else 
stk.push(POINT(xt - 1, y)); 
} 


/* 向 右 跳 过 内 部 的 无 效 点 ( 处 理 区 间 右 端 有 障碍 点 的 情况 ) */ 
int xspan = SkipInvalidInLine(xt, y, xRight, new color, boundary color); 
xt += (xspan == 0) ? 1 : xspan; 
/* 处 理 特殊 情况 ,以 退出 while(x<=xright) 循 环 */ 
} 


最 外 层 的 while 循环 是 为 了 保证 区 间 [xLeft, xRight] 右 端 被 障碍 点 分 隔 成 多 段 的 情况 能 够 得 到 
正确 处 理 ， 通 过 外 层 while 循环 ， 可 以 确保 为 每 一 段 都 找到 一 个 种 子 点 ( 对 于 障碍 点 在 区 间 左 端 
的 情况 ,请 参考 图 14-19 所 示 实 例 的 解释 , 是 隐 含 在 算法 中 完成 的 )。 内 层 的 while 循环 只 是 为 了 


找到 每 一 段 最 右 端的 一 个 可 填充 点 作为 种 子 点 。SkipInvalidInLine() 子 数 的 作用 部 


是 明 


k 过 区 间 内 


的 障碍 点 ,确定 下 一 个 分 隔 段 的 开始 位 置 。 循 环 内 的 最 后 一 行 代码 有 点 奇怪 , 其实 只 是 用 了 一 个 
小 “诡计 "， 确 保 在 遇 到 真正 的 边界 点 时 循环 能 够 正确 退出 。 这 不 是 一 个 值得 称道 的 做 法 ， 实 现 
此 类 软件 控制 有 更 好 的 方法 ,这 里 这 样 做 的 目的 只 是 为 了 使 代码 简短 一 些 , 让 读者 把 注意 力 集中 


在 算法 处 理 逻 辑 上 ， 而 不 是 元 杂 难 懂 的 循环 控制 条 件 上 。 


算法 的 实现 其 实 就 在 ScanLineSeedFil1() 和 SearchLineNewSeed() 两 个 函数 中 ,神秘 的 扫 撒 线 种 
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子 填 充 算法 也 并 不 复杂 , 对 吧 ? 至 此 , 种 子 填 充 算法 的 几 种 常见 算法 都 已 经 介绍 完毕 , 接 下 来 将 
介绍 两 种 适合 矢量 图 形 区 域 填充 的 填充 算法 , 分 别 是 扫描 线 算法 和 边 标 志 填 充 算法 , 注意 适合 天 
量 图 形 的 扫描 线 填 充 算法 有 时 又 称 为 “有 序 边 表 法 ”， 和 扫描 线 种 子 填充 算法 是 有 区 别 的 。 
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扫描 线 填充 算法 适合 对 矢量 图 形 进 行 区 域 填 充 ， 只 需要 知道 多 边 形 区 域 的 几何 位 置 ， 不 需要 
指定 种 子 点 ,适合 计算 机 自动 进行 图 形 处 理 的 场合 使 用 , 比如 电脑 游戏 和 三 维 CAD 软件 的 泻 染 等 。 

对 矢量 多 边 形 区 域 填 充 ， 算法 核心 还 是 求 交 。14.1.6 节 给 出 了 判断 点 与 多 边 形 关 系 的 算 
法 一 一 扫描 交点 的 奇偶 数 判断 算法 ,利用 此 算法 可 以 判断 一 个 点 是 否 在 多 边 形 内 ， 也 就 是 是 否 
需要 填充 , 但 是 实际 工程 中 使 用 的 填充 算法 都 是 只 使 用 求 交 的 思想 ， 并 不 直接 使 用 这 种 求 交 算 
法 。 究 其 原因 ， 除 了 算法 效率 问题 之 外 ， 还 存在 一 个 光栅 图 形 设 备 和 矢量 之 间 的 转换 问题 。 比 
如 某 个 点 位 于 非常 靠近 边界 的 临界 位 置 ， 用 矢量 算法 判断 这 个 点 应 该 是 在 多 边 形 内 ， 但 是 光栅 
化 后 ， 这 个 点 在 光栅 图 形 设备 上 看 就 有 可 能 是 在 多 边 形 外 边 (矢量 点 没有 大 小 概念 ， 光 机 图 形 
设备 的 点 有 大 小 概念 )， 因 此 ， 适 用 于 矢量 图 形 的 填充 算法 必须 适应 光栅 图 形 设备 。 

1. 扫描 线 填 充 算法 的 基本 思想 

扫描 线 填 充 算 法 的 基本 思想 是 : 用 水 平 扫描 线 从 上 到 下 (或 从 下 到 上 ) 扫描 由 多 条 首尾 相连 
的 线段 构成 的 多 边 形 ,每 根 扫 描 线 与 多 边 形 的 某 些 边 产生 一 系列 交点 。 将 这 些 交 点 按照 x 坐标 排 
序 , 将 排序 后 的 点 两 两 成 对 ， 作 为 线段 的 两 个 端点 ， 以 所 填 的 颜色 画 水 平 直线 。 多 边 形 被 扫描 完 
毕 后 ， 颜 色 填 充 也 就 完成 了 。 扫 描 线 填充 算法 也 可 以 归纳 为 以 下 4 个 步骤 。 

(1) 求 交 ， 计 算 扫 描 线 与 多 边 形 的 交点 。 

(2) 交点 排序 ， 对 第 (2) 步 得 到 的 交点 按照 x 值 从 小 到 大 进行 排序 。 

(3) 颜色 填充 ， 对 排序 后 的 交点 两 两 组 成 一 个 水 平 线段 ， 以 画 线 段 的 方式 进行 颜色 填充 。 

(4) 是 否 完成 多 边 形 扫 描 ? 如 果 是 就 结束 算法 ， 如 果 不 是 就 改变 扫描 线 ， 然 后 转 第 (1) 步 继续 
人 处理。 

整个 算法 的 关键 是 第 (1) 步 , 需要 用 尽量 少 的 计算 量 求 出 交点 , 还 要 考虑 交点 是 线段 端点 的 特 
殊 情况 ， 最后， 交点 的 步 进 计算 最 好 是 整数 ,便于 光栅 设备 输出 显示 。 

对 于 每 一 条 扫描 线 ， 如 果 每 次 都 按照 正常 的 线段 求 交 算法 进行 计算 , 则 计算 量 大 , 而 且 效 率 
低下 ， 如 图 14-20 所 示 ， 观 察 多 边 形 与 扫描 线 的 交点 情况 ， 可 以 得 到 以 下 两 个 特点 。 
每 次 只 有 相关 的 几 条 边 可 能 与 扫描 线 有 交点 ， 不 必 对 所 有 的 边 进行 求 交 计算 ; 
口 相 邻 的 扫描 线 与 同一 直线 段 的 交点 存在 步 进 关系 , 这 个 关系 与 直线 段 所 在 直线 的 斜率 有 关 。 
第 一 个 特点 是 显而易见 的 ， 为 了 减少 计算 量 ， 扫 描 线 算法 需要 维护 一 张 由 “活动 边 ” 组 成 的 
表 ， 称 为 活动 边 表 (AET )。 例 如 扫描 线 4 的 活动 边 表 由 已 P; 和 PP4 两 条 边 组 成 ， 而 扫描 线 7 的 
活动 边 表 由 PI.P,、PeP1、PsPe。 和 PsPs 四 条 边 组 成 。 


224 PF 第 14 章 计算 几何 与 计算 机 图 形 学 


第 二 个 特点 可 以 进一步 证 明 , 假设 当前 扫描 线 与 多 边 形 的 某 一 条 边 的 交点 已 经 通过 直线 段 求 


交 算 法 计算 出 来 ， 得 到 交点 的 坐标 为 (x, y)， 则 下 一 条 扫描 线 与 这 条 边 的 交点 不 需要 再 求 交 计 算 ， 


直线 的 斜率 有 关 ， 下 面 就 来 推导 这 个 Ax。 


+ 了 

11 

ior Ps(9,10) 

9 
Pi(2,8) 
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pe 
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3 Ps(7,6) 

1 | P13,5) 
| p(1,3) 

5 
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1 

全 由 本 天 2 


图 14-20 多边形 与 扫描 线 示意 图 


通过 步 进 关 系 可 以 直接 得 到 新 交点 坐标 为 (x+ Ax,y+1)。 前 面 提 到 过 ， 步 进 关 系 Ax 


Au _ EL 
是 个 常量 ， 上 后 


假设 多 边 形 某 条 边 所 在 的 直线 方程 是 ，ax + by +c =0， 扫 描 线 y; 和 下 一 条 扫描 线 yi, 与 该 边 


的 两 个 交点 分 别 是 Ge 加 和 (Cat yi)， 则 可 得 到 以 下 两 个 等 式 : 


axi:+ by:t+c=0 


axin1 + by +c=0 
式 (14-19) 经 过 变换 可 以 得 到 式 (14-21): 
Xi=—(byit+c)/a 
同样 ， 式 (14-20) 经 过 变换 可 以 得 到 式 (14-22): 


Xi1=— (by t+ce)/a 
由 式 (14-22) 与 式 (14-21) 进 行 等 式 相 减 ， 得 到 式 (14-23): 
x -Xi=-b (ym-y)/a 
由 于 扫描 线 存在 yi,1 = 六 + 1 的 关系 ， 将 其 代入 式 (14-23) 后 可 得 式 (14-24): 


Xi#l—Xi=—-b/a 


即 Ax = -2 /aa， 是 个 常量 ( 直线 斜率 的 倒数 )。 


(14-19) 
(14-20) 


(14-21) 


(14-22) 


(14-23) 


(14-24) 


活动 边 表 是 扫描 线 填充 算法 的 核心 , 整个 算法 都 是 围绕 着 这 张 表 进行 处 理 的 。 要 完整 地 定义 
活动 边 表 , 需要 先 定 义 边 的 数据 结构 。 每 条 边 都 和 扫描 线 有 个 交点 ,扫描 线 填充 算法 只 关注 交点 
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的 x 坐标 。 每 当 处 理 下 一 条 扫描 线 时 , 根据 Ax 直接 计算 出 新 扫描 线 与 边 的 交点 x 坐标 , 可 以 避免 
复杂 的 求 交 计算 。 一 条 边 不 会 一 直 待 在 活动 边 表 中 ， 当 扫 措 线 与 之 没有 交点 时 , 要 将 其 从 活动 边 

表 中 删除 ， 判 断 是 否 有 交点 的 依据 就 是 看 扫描 线 y 是 否 大 于 这 条 边 两 个 端点 的 坐标 值 ， 为 此 ， 

需要 记录 边 的 坐标 的 最 大 值 。 根 据 以 上 分 析 ， 边 的 数据 结构 可 以 定义 如 下 : 4 


typedef struct tagEDGE 


double xi; 

double dx; 

int ymax; 
}EDGE; 


根据 EDGE 的 定义 ,扫描 线 4 和 扫描 线 7 的 活动 边 表 就 如 图 14-21 所 示 。 
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扫描 线 4 的 活动 边 表 
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扫描 线 7 的 活动 表 


图 14-21 扫描 线 的 活动 边 表示 意图 
前 面 提 到 过 ,扫描 线 算法 的 核心 就 是 围绕 活动 边 表 展开 的 ,为 了 方便 活性 边 表 的 建立 与 更 新 ， 
我 们 为 每 一 条 扫描 线 建 立 一 个 新 边 表 (NET )， 存 放 该 扫描 线 第 一 次 出 现 的 边 。 当 算法 处 理 到 某 
条 扫描 线 时 , 就 将 这 条 扫描 线 的 新 边 表 中 的 所 有 边 逐 一 插入 到 活动 边 表 中 。 新 边 表 通常 在 算法 开 
台 时 建立 ， 建 立新 边 表 的 规则 就 是 : 如 果 某 条 边 的 较 低 端点 (y 坐标 较 小 的 那个 点 ) 的 y 坐标 与 
扫描 线 y 相 等 ， 则 该 边 就 是 扫描 线 y 的 新 边 ， 应 该 加 入 扫描 线 y 的 新 边 表 。 上 例 中 各 扫描 线 的 新 
边 表 如 图 14-22 所 示 。 


Ph, PP 
1 -55020| 5 50|-20| 3 
< PP, 
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图 14-22 ”各 扫描 边 的 新 边 表 
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讨论 完 活动 边 表 和 新 边 表 , 就 可 以 开始 算法 的 具体 实现 了 , 但 是 在 进一步 详细 介绍 实现 算法 
之 前 ， 还 有 以 下 三 个 关键 的 细 闻 问题 需要 明确 。 

(1) 多 边 形 顶 点 处 理 。 在 对 多 边 形 的 边 进行 求 交 的 过 程 中 ， 在 两 条 边 相 连 的 顶点 处 会 出 现 一 
些 特殊 情况 ,因为 此 时 两 条 边 会 和 扫描 线 各 求 的 一 个 交点 , 也 就 是 说 ,在 顶点 位 置 会 出 现 两 个 交 
点 。 当 出 现 这 种 情况 的 时 候 , 会 对 填充 产生 影响 ， 因 为 填充 的 过 程 是 成 对 选择 交点 的 过 程 ， 错 误 
地 计算 交点 个 数 ， 会 造成 填充 异常 。 


Il 


假设 多 边 形 按照 顶点 P|、P, 和 P; 的 顺序 产生 两 条 相 邻 的 边 ，P; 就 是 所 说 的 顶点 。 多 边 形 的 
顶点 一 般 有 四 种 情况 , 如 图 14-23 所 展示 的 那样 , 分 别 被 称 为 左 顶 点 、 右 项 点、 上 顶点 和 下 顶点 ， 
它们 的 坐标 满足 以 下 关系 。 

左 顶 点 一 一 PI 、 P 忆 和 和 Py 的 了 坐标 满足 条 件 2 Jy1 <<]2 <y; 

右 顶 点 一 一 P1、P; 和 P; 的 yy 坐标 满足 条 件 : yi > yy>y;; 

上 顶点 一 一 P11、P; 和 P; 的 yy 坐标 满足 条 件 : yy > yi && yy >y;; 

下 顶点 一 一 P1、P; 和 P; 的 yy 坐标 满足 条 件 : yy <yi && yy <y;; 

对 于 左 顶 点 和 右 顶 点 的 情况 ， 如果 不 做 特殊 人 处 理会 导致 奇偶 奇数 错误 , 常 采 用 的 修正 方法 是 
修改 以 顶点 为 终点 的 那 条 边 的 区 间 , 将 顶点 排除 在 区 间 之 外 , 也 就 是 删除 这 条 边 的 终点 ,这 样 在 
计算 交点 时 ， 就 可 以 少 计算 一 个 交点 ， 平 衡 和 交点 奇偶 个 数 。 结 合 前 面 定 义 的 “ 边 ” 数 据 结构 : 
EDGE， 只 要 将 该 边 的 ymax 修改 为 ynax-1 就 可 以 了 。 

对 于 上 顶点 和 下 顶点 , 一 种 处 理 方法 是 将 交点 计算 为 0 个 , 也 就 是 修正 两 条 边 的 区 间 , 将 交 


点 从 两 条 边 中 排除 ; 男 一 种 处 理 方法 是 不 做 特殊 处 理 , 就 计算 2 个 交点 , 这样 也 能 保证 交点 奇偶 
个 数 平衡 。 

(2) 水 平 边 的 处 理 。 水 平 边 与 扫描 线 重 合 ， 会 产生 很 多 交点 ， 通 常 的 做 法 是 将 水 平 边 直接 画 
出 (填充 )， 然 后 在 后 面 的 处 理 中 忽略 水 平 边 ， 不 对 其 进行 求 交 计算 。 

(3) 如 何 避 免 填 充 越过 边界 线 。 边 界 像素 的 取舍 问题 也 需要 特别 注意 。 多 边 形 的 边界 与 扫描 
线 会 产生 两 个 交点 ,填充 时 如 果 对 两 个 交点 以 及 之 间 的 区 域 都 填充 ,容易 造成 填充 范围 扩大 ， 影 
响 最 终 光 栅 图 形 化 显示 的 填充 效果 。 为 此 ， 人 们 提出 了 “ 左 闭 右 开 ”的 原则 ， 简 单 解释 就 是 ， 如 
果 扫 撒 线 交 点 是 1 和 9， 则 实际 填充 的 区 间 是 [1,9)， 即 不 包括 x 坐标 是 9 的 那个 点 。 

2. 扫描 线 算 法 实现 
扫描 线 算法 的 整个 过 程 都 是 围绕 活动 边 表 展开 的 , 为 了 正确 初始 化 活动 边 表 , 需要 初始 化 每 
条 扫描 线 的 新 边 表 ， 首先 定义 新 边 表 的 数据 结构 。 定 义 新 边 表 为 一 个 数组 , 数组 的 每 个 元 素 存 放 
对 应 扫描 线 的 所 有 新 边 。 因 此 定义 新 边 表 如 下 : 

std: :vector< std::]ist<EDOE> > slNet(ymax - ymin + 1); 


ymax 和 ymin 是 多 边 形 所 有 顶点 中 yy 坐标 的 最 大 值 和 最 小 值 ,用 于 界定 扫描 线 的 范围 。 slNet 中 
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的 第 一 个 元 素 对 应 的 是 ymin 所 在 的 扫 摘 线 ， 以 此 类 推 ， 最 后 一 个 元 素 是 ymax 所 在 的 扫描 线 。 在 
开始 对 每 条 扫描 线 处 理 之 前 ， 需 要 先 计 算出 多 边 形 的 ymax 和 ymin 并 初始 化 新 边 表 。 
GetPolygonMinMax() 函 数 遍 历 多 边 形 的 所 有 顶点 ， 求 出 ymax 和 ymin。 


Ps PR 
ps Pp ! 
P, 
P, 
a Pp; 
Ps 
P, A 2 
(a) 左 顶点 (b) 右 顶 点 
Pf a Ps 
PI 
Ps, P, 
(c) 上 顶点 (qd) 下 顶点 


图 14-23 多边形 顶点 的 


并 
组 


void ScanLinePolygonFill(const Polygon& py, int color) 


{ 
assert(py.IsValid()); 
int ymin = 0; 
int ymax = 0; 
GetPolygonMinMax (py, ymin, ymax); 
std::vector< std::list<EDGE> > slNet(ymax - ymin + 1); 
InitScanLineNewEdgeTable(slNet, py, ymin, ymax); 
//PrintNewEdgeTable(slNet); 
HorizonEdgeFill(py，color); // 水 平 边 直接 画 线 填充 
ProcessScanLineFill(slNet, ymin, ymax, color); 

} 


InitscanLineNewEdgeTable() 消 数 根据 多 边 形 的 顶点 和 边 的 情况 初始 化 新 边 表 ， 实 现 过 程 中 体 
现 了 对 左 顶 点 和 右 项 点 的 区 间 修 正 原则 . 


void InitScanLineNewEdgeTable(std::vector< std::list<EDGE> >& slNet, 
const Polygon& py, int ymin, int ymax) 
{ 


EDOE @; 
for(int i = 0; i < py.GetPolyCount(); i++) 
{ 


const Point& ps = py.pts[i]; 

const Point& pe = py.pts[(i + 1) % py.GetPolyCount()]; 
const Point& pss = py.pts[(i - 1 + py.GetPolyCount()) % py.GetPolyCount()]; 
const Point& pee = py.pts[(i + 2) % py.GetPolyCount()]; 
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if( 
{ 


} 


} 


点 , pee 是 终点 


void ProcessScanLineFill(std::vector< std::list<EDGE> >& slNet, 
in, int ymax, int color) 


int ym 
{ 


std::1i 


for(int 


{ 


pe.y != ps.y) // 不 处 理 水 平 线 


e.dx = double(pe.x - ps.x) / double(pe.y - ps.y); 
ny > ps.y) 


e.xi = ps.x; 
if(pee.y >= pe.y) 
e.ymax = pe.y - 1; 
else 
e.ymax = pe.y; 


slNet[ps.y - ymin].push front(e); 


} 
else 
{ 
e.xi = pe.x; 
if(pss.y >= ps.y) 
e.ymax = ps.y - 1; 
else 
e.ymax = ps.y; 
slNet[pe.y - ymin].push front(e); 
} 


算法 通过 遍历 所 有 的 顶点 获得 边 的 信息 , 然后 根据 与 此 边 有 关 的 前 后 两 个 顶点 的 情况 确定 此 
边 的 ymax 是 否 需 要 -1 修正 。ps 和 pe 分 别 是 当前 处 理 边 的 起 点 和 


终点 ，pss 是 起 点 的 前 一 个 相 邻 


的 后 一 个 相 邻 点 , pss 和 pee 用 于 辅助 判断 ps 和 pe 两 个 点 是 否 是 左 顶点 或 右 顶 点 ， 
然后 根据 判断 结果 对 此 边 的 ymax 进行 -1 修正 ， 算 法 实现 非常 简单 ， 注 意 与 扫描 线 平行 的 边 是 不 
处 理 的 ， 因 为 水 平 边 直 接 在 HorizonEdgeFill() 函 数 中 填充 了 。 

ProcessScanLineFill() 国 数 开 始 对 每 条 扫描 线 进行 处 理 ， 对 每 条 扫描 线 的 处 理 有 四 个 操作 ， 
如 下 代码 所 示 ， 四 个 操作 分 别 被 封装 到 四 个 函数 中 : 


St<EDOE> aet; 


y = ymin; y <= ymax; y++) 


InsertNetListToAet(slNet[y - ymin], aet); 


Fil 


lAetScanLine(aet, y, color); 


yk 
Re 


别 除 非 活动 边 
oveNonActiveEdgeFromAet(aet, y); 


// 更 新 活动 边 表 中 每 项 的 xi 值 ， 并 根据 xi 重新 排序 


UpdateAndResortAet (aet); 


} 
} 


InsertNetL 


istToAet() 函 数 负 责 将 扫描 线 对 应 的 所 有 新 边 插入 到 aet 中 ,插入 操作 到 保证 aet 


还 是 有 序 表 ， 应 用 了 插入 排序 的 思想 ， 实 现 简单 ， 此 处 不 多 解释 。FillAetscanLine() 函 数 执行 具 
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体 的 填充 动作 ， 它 将 aet 中 的 边 交 点 成 对 取出 组 成 填充 区 间 ， 然 后 根据 “ 左 闭 右 开 ”的 原则 对 每 
个 区 间 填 充 ， 实 现 也 很 简单 ， 此 处 不 多 解释 。RemoveNonActiveEdgeFromAet() 函 数 负 责 将 对 下 一 条 


扫描 线 来 说 已 经 不 是 “活动 边 ” 的 边 从 aet 中 删除 ， 
相等 ， 如 果 有 多 条 边 满 足 这 个 条 件 ， 则 一 并 删除 : 


bool IsEdgeOutOfActive(EDGE e, int y) 
{ 


return (e.ymax == y); 


} 


void RemoveNonActiveEdgeFYomAet(std: :1ist<EDGE>& aet 
{ 


删除 的 条 件 就 是 当前 扫描 线 y 与 边 的 ymax 4 


;Tnt, y) 


aet.remove if(std::bind2nd(std::ptr fun(IsEdgeOutOfActive), y)); 


} 


UpdateAndResortAet() 消 数 更 新 边 表 中 每 项 的 xi 值 ， 就 是 根据 扫描 线 的 连贯 性 用 dx 对 其 进行 
修正 ， 并 且 根 据 xi 从 小 到 大 的 原则 对 更 新 后 的 aet 表 重新 排序 : 


void UpdateAetEdgeInfo(EDGE® e) 
{ 
e.xi += e.dx; 
} 
bool EdgeXiComparator(EDGE& e1, EDGE& e2) 


return (e1.xi <= e2.xi); 


} 
void UpdateAndResortAet(std::1ist<EDGE>& aet) 
{ 

// 更 新 xi 


for each(aet.begin(), aet.end(), UpdateAetEdgeInfo); 


// 根 据 xi 从 小 到 大 重新 排序 
aet.sort(EdgeXiComparator); 


} 


其 实 更 新 完 xi 后 对 aet 表 的 重新 排序 是 可 以 避免 的 ， 只 要 在 维护 aet 时 ， 除 了 保证 xi 从 小 
到 大 的 排序 外 , 在 xi 相同 的 情况 下 如 果 能 保证 修正 量 dx 也 是 从 小 到 大 有 序 ， 就 可 以 避免 每 次 对 


aet 进行 重新 排序 。 算 法 实现 也 很 简单 ， 只 需要 对 Ins 
趣 的 朋友 可 以 自行 修改 。 


ertNetListToAet () 函 数 稍 作 修改 即 可 ， 有 兴 


至 此 , 扫描 线 算法 就 介绍 完了 , 算法 的 思想 看 似 复杂 ,实际 上 并 不 难 ， 从 具体 算法 的 实现 就 


可 以 看 出 来 ， 整 个 算法 实现 不 足 百 行 代码 。 
14.5.3 ”改进 的 扫描 线 填 充 算 法 


扫描 线 填充 算法 的 原理 和 实现 都 很 简单 , 但 是 因为 要 同时 维护 活动 边 表 和 新 边 表 , 对 存储 空 


间 的 要 求 比较 高 。 这 两 张 表 的 部 分 内 容 是 重复 的 ， 而 | 


昌 新 边 表 在 很 多 情况 下 都 是 一 张 稀 玖 表 ， 如 
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果 能 对 其 进行 改进 , 避免 出 现 两 张 表 , 就 可 以 节省 存储 空间 , 同时 省 去 从 边 表 生成 新 边 表 的 开销 ， 
同时 也 省 去 了 用 新 边 表 维 护 活动 边 表 的 开销 ， 基 于 这 个 原则 可 以 对 原始 扫描 线 算法 进行 改进 。 

1. 重新 设计 活动 边 表 

改进 的 算法 仍然 使 用 了 活动 边 表 的 概念 , 但 是 不 再 构造 独立 的 活动 边 表 , 而 是 直接 在 边 表 中 
划 定 一 部 分 区 间作 为 活动 边区 间 , 也 就 是 说 ,把 多 边 形 的 边 分 成 两 个 子 集 , 一 个 是 与 扫描 线 有 交 
点 的 边 的 集合 , 另 一 个 是 与 扫描 线 没 有 交点 的 边 的 集合 。 要 达到 这 个 目的 ， 只 需要 对 活动 边 表 按 
照 每 条 边 的 顶点 ymax 坐标 排序 即 可 。 这 个 排序 与 原始 扫描 线 算法 中 对 活动 边 表 的 维护 原理 是 一 
样 的 ， 因 为 只 有 边 的 ymax 坐标 区 间 内 与 扫描 线 有 交点 的 边 才 可 能 是 活动 边 。 为 了 避免 重复 扫描 
整个 活动 边 表 ， 需 要 用 一 个 first 指针 和 一 个 1ast 指针 用 于 标识 活动 边区 间 。first 指针 之 前 的 
边 都 是 已 经 处 理 过 的 边 ， 同 样 ，last 指针 之 后 的 边 都 是 还 没有 人 处理 的 边 。 每 处 理 完 一 条 扫描 线 ， 
都 要 更 新 first 和 1ast 指针 位 置 ， 调 整 1ast 指针 的 位 置 将 ymax 大 于 当前 扫描 线 的 边 纳 入 到 活动 
边区 间 ， 同 时 调整 first 指针 将 处 理 完成 的 边 排除 在 活动 边区 间 之 外 。 

如 果 调 整 1ast 指针 的 依据 是 边 的 ymax 是 否 大 于 当前 扫描 线 ， 那 么 调整 first 指针 的 依据 是 
什么 ?也 就 是 如 何 判 断 一 条 边 已 经 处 理 完了 ? 方法 是 在 边 ( EDGE ) 定义 中 增加 一 个 dy( Ay) 属 性 ， 
这 个 属性 被 初始 化 成 这 条 边 在 y 方向 上 的 长 度 ， 每 处 理 完 一 条 扫描 线 ，dy 都 要 做 减 一 处 理 ， 当 
dy =0 时 ， 就 说 明 这 条 边 已 经 不 与 扫描 线 相 交 了 ， 可 以 被 排除 在 活动 边区 间 之 外 。 改 进 的 扫描 线 
算法 的 “ 边 ” 的 完整 定义 如 下 : 


typedef struct tagEDGE2 
{ 


double xi; 
double dx; 
int ymax; 
int dy; 
}EDGE2; 


EDGE2 定义 中 xi、dx 和 ymax 的 含义 和 原始 算法 中 EDGE 的 定义 相同 ， 只 是 多 了 一 个 dy 属性 。 


每 当 处 理 一 条 扫描 线 时 ， 除 了 活动 边区 间 的 first 指针 和 1ast 指针 需要 调整 之 外 ， 还 要 将 
first 指针 和 1ast 指针 之 间 的 活动 边 按照 xi 从 小 到 大 的 顺序 排序 ,以 保证 填充 算法 能 够 用 正确 的 
交点 线段 序列 画 线 填 充 。 因 此 ,每 次 调整 活动 边区 间 的 first 指针 和 1ast 指针 之 后 ,都 要 对 活动 
边区 间 重 新 排序 , 也 就 是 说 活动 边区 间 内 的 各 边 的 位 置 并 不 固定 , 会 随 着 扫描 线 的 变化 而 相应 地 


变化 。 


仍 以 图 14-20 所 示 的 多 边 形 为 例 ， 处 理 扫描 线 10 时 的 活动 边 表 状态 如 图 14-24a 所 示 ， 而 处 
理 扫描 线 8 时 的 活动 边 表 状 态 则 如 图 14-24b 所 示 。 可 以 看 出 ， 当 处 理 扫 描 线 8 时 ,活动 边 区 间 
内 的 边 的 顺序 有 了 调整 ， 因 为 新 加 入 的 PeP1 和 PiP; 两 条 边 与 扫描 线 的 交点 坐标 x; 比 PsPs 与 扫描 
线 的 交点 坐标 x; 小 ， 因 此 排 在 PsPe 前 面 。 
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(a) 


2. 新 活动 边 表 的 构造 与 调整 


图 14-24 ”改进 的 活 


(b) 


动 边 表 结构 


改进 的 扫描 线 算法 的 重点 是 活动 边 表 的 构造 和 调整 ， 构 造 方法 如 下 。 
口 首先 剔除 多 边 形 各 边 的 水 平 边 ， 然 后 将 剩 下 的 边 按 照 ymax 的 值 从 大 到 小 的 顺序 存 人 一 个 
线性 表 中 ， 表 中 第 一 个 元 素 是 ymax 值 最 大 的 表 ， 最 后 一 个 元 素 是 ymax 值 最 小 的 边 。 对 于 
各 边 中 左 、 右 顶点 的 情况 需要 和 原始 算法 一 样 做 调整 ， 以 免 出 现 交 点 个 数 不 正 确 的 异常 。 
这 里 对 调整 的 策略 再 强调 一 下 ， 调 整 都 是 针对 边 的 终点 进行 的 ， 对 于 图 14-23a 所 示 的 左 
顶点 ， 需 要 先 将 P 点 的 坐标 调整 为 x， dr,) - 1)， 然 后 再 求 边 的 ymax、xi 和 dy。 对 于 
图 14-23b 所 示 的 右 顶 点 ， 需 要 将 PP 点 的 坐标 调整 为 x+ dx, y+ 1)， 然 后 再 求 边 的 ymax、 


Xi 和 dyo 


口 加 入 first 指针 和 1ast 指针 , 构成 活动 边区 间 。first 指针 和 1ast 指针 之 间 的 边 都 是 和 当 


前 扫描 线 有 交点 的 边 或 已 经 处 理 过 的 边 ， 已 经 处 至 


经 是 


描 时 需要 忽略 其 中 dy 已 


整 first 指针 时 被 剔除 出 活动 边区 间 。 


活动 边 表 的 调整 指 的 是 在 处 理 


过 的 边 的 dy 是 0， 因 此 ， 对 活动 边 扫 
0 的 边 。 这 些 已 经 处 理 过 的 边 会 加 载 在 正常 的 边 中 ， 直 到 调 


E 完 每 根 扫描 线 之 后 , 更 新 活动 边 表 中 活动 边区 间 内 的 各 边 的 相 


关 属 性 的 值 ， 比 如 递减 dy 的 值 ， 调 整 交点 x; 坐标 的 值 等 。 根 据 EDGE2 的 定义 ， 每 根 扫描 线 处 理 


完 之 后 需要 对 活动 边区 间 内 的 边 做 两 步调 整 , 首先 调整 活动 边区 间 中 参与 求 交 计 算 的 各 边 的 


值 ， 这 些 调整 算法 是 : 


if(first 所 指 边 的 Ay 为 0) 
first=first+1; 


dy=dy-1 


日 


Xi = Xi - dx; 


然后 调整 活动 边区 间 的 first 指针 和 1ast 指针 , 使 符合 条 件 的 新 边 加 入 到 活动 边区 间 , 同时 
将 处 理 完 的 边 从 活动 边区 间 易 除 。 这 些 调 整 算法 是 : 


if(last 所 指 的 下 一 条 边 的 ymax 大 于 下 一 扫描 线 的 y 值 ) 


last=last+1 


己 
Es 性 
疝 
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3. 改进 的 扫描 线 填充 算法 实现 


首先 定义 活动 边 表 ， 这 是 一 个 线性 表 ， 每 个 元 素 是 一 条 边 的 全 部 属性 ， 同 时 还 要 包含 first 
指针 和 last 指针 ， 其 数据 结构 定义 如 下 : 


typedef struct tagSP_ EDGES TABLE 


std: :vector<EDGE2> slEdges; 
int first; 
int last; 

}SP_EDGES TABLE; 


改进 的 扫描 线 填充 算法 重点 仍然 是 新 活动 边 表 的 构造 ， 构 造 新 活动 边 表 的 算法 实现 如 下 : 


void InitScanLineEdgesTable(SP_ EDGES TABLE& spET, const Polygon& py) 
{ 


EDGE2 e; 

for(int i = 0; i < py.GetPolyCount(); i++) 

{ 
const Point& ps = py.pts[i]; 
const Point& pe = py.pts[(i + 1) % py.GetPolyCount()]; 
const Point& pee = py.pts[(i + 2) % py.GetPolyCount()]; 


if(pe.y != ps.y) // 不 处 理 水 平 线 
{ 


e.dx = double(pe.x - ps.x) / double(pe.y - ps.y); 
3 > ps.y) 


if(pe.y 《< pee.y) // 左 顶点 
{ 
e.Xxi = pe.x - e.dx; 


e.ymax = pe.y - 1; 
e.dy = e.ymax - ps.y + 1; 


} 
else 
{ 
e.xi = pe.x; 
e.ymax = pe.y; 
e.dy = pe.y - ps.y + 了 1) 
} 


} 
else //(pe.y < ps.y) 
小 


if(pe.y > pee.y) // 右 顶点 
{ 


e.xi = ps.x; 
e.ymax = ps.y; 
e.dy = ps.y - (pe.y + 1) + 1; 


else 


{ 
e.Xxi = ps.x; 
e.ymax = ps.y; 
e.dy = ps.y - pe.y+1; 
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} 
} 


InsertEdgeToEdgesTable(e, spET.slEdges); 


} 
spET.first = spET.1last = 0; 

} 

多 边 形 Polygon 中 的 pts 数组 按照 顺序 存放 了 多 边 形 的 各 个 顶点 ，InitScanLineEdgesTable() 
函数 从 pts 中 依次 取出 三 个 项 点， 前 两 个 项 点 构成 当前 处 理 的 边 , 后 一 个 顶点 用 于 辅助 判断 是 否 
是 左 、 右 顶点 的 情况 ,如果 是 左 、 右 顶点 的 情况 ,就 要 对 边 的 终点 的 坐标 做 调整 ( 调整 的 方法 我 
们 在 前 面 已 经 描述 过 )。 调 整 完 线段 终点 坐标 后 构造 边 e， 然 后 由 InsertEdgeToEdgesTable() 函数 


将 e 插 入 到 线性 表 中 ,插入 操作 满足 线性 表 按 照 ymax 从 大 到 小 排序 ,这 个 是 插入 排序 的 基本 算法 ， 
这 里 就 不 再 列 出 代码 。 

算法 的 男 一 个 重点 就 是 处 理 每 条 扫描 线 和 活动 边 表 的 关系 , 计算 出 每 条 扫描 线 需 要 填充 的 区 
间 。 这 个 算法 体现 在 ProcessScanLineFil12() 范 数 中 : 


void ProcessScanlLineFill2(SP_ EDGES TABLE& spET, 
int ymin, int ymax, int color) 


{ 
for (int yScan = ymax; yScan >= ymin; yScan--) 
{ 
UpdateEdgesTableActiveRange(spET, yScan); 
SortActiveRangeByX(spET); 
FillActiveRangeScanLine(spET, yScan, color); 
UpdateActiveRangeIntersection(spET); 
} 
} 


ProcessScanLineFi112() 也 数 依次 处 理 每 条 扫描 线 ， 根据 14.5.3 第 2 小 节 的 算法 描述 ， 
UpdateEdges TableActiveRange() 了 艺 数 和 SortActiveRangeByX() 函 数 更 新 活动 边区 间 并 对 区 间 内 的 边 
排序 ，FillActiveRangescanLine 消 数 从 活动 边区 间 内 依次 取出 两 个 交点 组 成 填充 区 间 ， 调 用 前 面 
介绍 的 DrawHorizontalLine() 隐 数 完 成 画 线 填充 ，UpdateActiveRangeIntersection() 函 数 则 根据 
14.5.3 第 2 小 节 的 算法 描述 更 新 参与 求 交 计算 的 各 边 的 属性 值 。 这 四 个 函数 的 实现 都 很 简单 ， 结 
合 14.5.3 第 2 小 节 的 算法 描述 很 容易 理解 。 


14.5.4 ”边界 标志 填充 算法 


在 光栅 显示 平面 上 , 多边 形 是 封闭 的 , 它 是 用 某 一 边界 色 围 成 的 一 个 闭合 区 域 , 填充 是 逐 行 
进行 的 ， 即 用 扫描 线 逐 行 对 多 边 形 求 交 , 在 交点 对 之 间 填 充 。 边 界 标志 填充 算法 就 是 在 逐 行 处 理 
时 ,利用 边界 或 边界 颜色 作为 标志 来 进行 填充 。 准 确 地 说 ,边界 标志 填充 算法 不 是 指 某 种 具体 的 
填充 算法 ,而 是 一 类 利用 扫描 线 连 贯 性 思想 的 填充 算法 的 总 称 。 这 类 算法 有 很 多 种 ， 本 节 就 介绍 
两 种 常见 的 边 填 充 算 法 。 
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1. 以 边 为 中 心 的 填充 算法 

首先 介绍 一 种 以 边 为 中 心 的 边缘 填充 算法 , 这 种 边界 标志 算法 的 基本 思想 是 : 对 于 每 一 条 扫 
描 线 和 每 一 条 多 边 形 边 的 交点 Cao, 将 该 扫描 线 上 交点 右 方 的 所 有 像素 取 补 , 依次 对 多 边 形 的 每 
条 边 做 此 处 理 ,， 直到 最 终 完成 填充 。 这 里 要 介绍 一 下 取 补 的 定义 ,假设 某 点 的 颜色 是 M， 则 对 该 
点 的 颜色 取 补 得 到 M'=4-M, 4 是 一 个 很 大 的 数字 ， 至 少 要 比 所 有 合法 的 颜色 值 大 。 根 据 取 补 
的 定义 ， 如 果 对 光栅 位 图 某 区 域 已 经 标记 为 M 的 颜色 值 做 偶数 次 取 补 运算 ， 该 区 域 颜 色 不 变 ; 
而 做 奇数 次 取 补 运算 ， 则 该 区 域 颜 色 变 为 值 为 M' 的 颜色 。 算 法 的 处 理 过 程 可 以 简单 地 描述 为 以 
下 两 个 步骤 。 

(1) 将 绘图 窗口 的 背景 色 置 为 M' 颜色; 

(2) 对 多 边 形 的 每 一 条 非 水 平 边 ， 从 该 边 上 的 每 个 像素 开始 向 右 求 余 。 

图 14-25 展示 了 这 两 个 步骤 的 处 理 流程 ,左边 是 多 边 形 的 形状 ， 右 边 分 别 是 对 每 条 边 处 理 完 
成 后 填充 区 域 的 颜色 情况 ， 初 始 背景 颜色 是 M'， 经 过 处 理 后 ， 需 要 填充 的 区 域 是 奇数 次 取 补 ， 
最 终 的 颜色 是 要 填充 的 正确 值 M， 非 填充 区 域 经 过 偶数 次 取 补 ， 仍 然 是 背景 色 M7'。 


5 
1 
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I 
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图 14-25 “边缘 填充 算法 的 处 理 过 程 


算法 的 实现 非常 简单 ， 对 于 光栅 位 图 的 展示 ,我 们 仍然 采用 之 前 所 用 的 方法 ,用 数字 矩阵 表 
示 一 块 光 栅 位 图 区 域 ， 和 矩阵 的 每 个 位 置 表示 一 个 像素 点 ， 用 0 ~ 9 表示 颜色 值 。 本 算法 示例 用 9 
表示 最 大 值 4，0 表示 无 效 的 区 域 ， 合 法 的 颜色 值 就 是 1~ 8。 


void EdgeCenterMarkFill(const Polygon& py, int color) 


std: :vector<EDGE3> et; 
InitScanLineEdgesTable(et，py);// 初 始 化 边 表 


FillBackground(A - color); // 对 整个 填充 区 域 背 景 颜色 取 补 
for each(et.begin()，et.end()，EdgeScanMarkColor);// 依 次 处 理 每 一 条 边 


14.5 多边形 区 域 填充 算法 号 235 


} 
void EdgeScanMarkColor(EDGE38 e) 
{ 
for(int y = e.ymax; y >= e.ymin; y--) 
{ 
int x = ROUND INT(e.xi); 
ComplementScanLineColor(x, MAX X CORD, y); 
e.xi -= e.dx; 
} 
} 


yy 


InitScanLineEdgesTable() 消 数 前 面 已 经 介绍 过 ，FillBackground() 函 数 将 填充 背景 初始 化 为 要 
填充 颜色 的 取 补 颜色 ，EdgescanMarkColor() 函 数 负责 对 每 条 非 水 平 边 进行 处 理 ， 逐 条 扫描 线 进行 
颜色 取 补 ，ComplementSscanLineColor() 函 数 负责 对 扫描 线 上 [cz x2] 区 间 的 点 的 颜色 值 取 补 。 

2. 栅栏 填充 算法 

以 边 为 中 心 的 填充 算法 的 优点 是 简单 , 缺点 是 对 于 复杂 多 边 形 ,每 一 像素 可 能 被 访问 多 次 (多 
次 取 补 )， 效 率 不 高 。 考 虑 对 此 算法 改进 ， 人 们 提出 了 栅栏 填充 算法 。 栅 栏 填充 算法 的 基本 思想 
是 : 经 过 多 边 形 的 某 个 顶点 ， 在 多 边 形 内 部 建立 一 个 与 扫描 线 垂直 的 “栅栏 ”"， 当 扫描 线 与 多 边 
形 边 有 交点 时 ， 就 将 交点 与 栅栏 之 间 的 像素 取 补 。 若 交点 位 于 栅栏 左边 ， 则 将 交点 之 右 , 栅栏 之 
左 的 所 有 像素 取 补 ; 若 交 点 位 于 栅栏 右边 ， 则 将 栅栏 之 右 ， 交 点 之 左 的 像素 取 补 。 

仍 以 上 一 节 介 绍 的 多 边 形 为 例 ,假设 经 过 PP 点 建立 一 条 栅栏 ， 则 改进 的 栅栏 填充 算法 处 理 过 
程 就 如 图 14-26 所 示 。 栅 栏 填充 算法 的 实现 和 以 边 为 中 心 的 边缘 填充 算法 类 似 ， 只 是 对 每 条 边 的 
扫描 线 取 补 处 理 的 范围 控制 有 区 别 ， 这 就 是 算法 需要 指定 一 个 “栅栏 ”的 原因 。 注 意 本 算法 中 
FenceScanMarkColor() 晴 数 和 EdgeScanMarkColor() 函 数 的 区 别 ,就 是 这 点 区 别 使 得 栅栏 填充 算法 主动 
减少 了 很 多 像素 被 访问 的 次 数 ， 而 多 边 形 之 外 的 像素 也 不 会 被 多 余 处 理 ， 效 率 提 高 了 不 少 。 


PP, P,P, 

(a) (1) O) 
Ppp; PP 

G) (4) 


图 14-26 栅栏 填充 算法 的 处 理 过 程 
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void EdgeFenceMarkFill(const Polygon& py, int fence, int color) 


{ 
std: :vector<EDGE3> et; 
InitScanLineEdgesTable(et，py);// 初 始 化 边 表 
FillBackground(A - color); // 对 整个 填充 区 域 背 景 颜色 取 补 
for each(et.begin(), et.end(), 
std::bind2nd(std::ptr fun(FenceScanMarkColor)，fence));// 依 次 处 理 每 一 条 边 
} 
void FenceScanMarkColor(EDGE3 e, int fence) 
{ 
for(int y = e.ymax; y >= e.ymin; y--) 
{ 
int x = ROUND INT(e.xi); 
if(x > fence) 
ComplementScanLineColor(fence, x, y); 
} 
else 
{ 
ComplementScanLineColor(x, fence - 1, y); 
} 
e.xi -= e.dx; 
4 
} 


14.6 总结 


本 章 介 绍 了 计算 机 图 形 学 中 一 些 常见 的 算法 , 还 有 包括 矢量 在 内 的 一 些 计算 几何 的 知识 。 这 
些 都 是 最 基础 的 内 容 , 但 是 通过 对 这 些 内 容 的 了 解 , 你 可 以 打开 算法 世界 的 一 个 重要 分 支 的 大 门 。 
比如 点 与 多 边 形 的 关系 、 判 断 多 边 形 的 凸凹 性 以 及 判断 多 边 形 之 间 的 相交 关系 , 都 是 算法 比赛 中 
比较 常见 的 题目 。 
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第 A 阐 


首 频 频谱 和 和 均衡 器 己 侍 里 叶 慨 换 第 ) 


音频 播放 时 的 频谱 实时 显示 和 调整 音效 的 均衡 器 功能 是 各 种 媒体 播放 程序 的 标准 配置 , 小 伙 
伴 们 可 曾 疑惑 过 它们 的 实现 原理 ? 我 上 学 的 时 候 也 想 自 己 编程 做 一 个 MP3 播放 带 ， 对 Winamp 
界面 上 那个 跳动 的 频谱 十 分 向 往 ， 最 终 因 为 不 知道 实现 原理 而 放弃 了 。 后 来 学 了 《数值 分 析 》， 
才 知 道 原来 背后 的 原理 就 是 傅 里 叶 变 换算 法 ,本章 就 介绍 一 下 傅 里 叶 变 换算 法 如 何 应 用 到 音频 播 


放 的 频谱 和 均衡 器 的 实现 中 ， 同 时 | 
这 也 离 不 开 传 里 叶 变换 算法 。 


15.1 ”实时 频谱 显示 的 原 


顺带 介绍 一 下 根据 电话 拨号 音 破解 电话 号 码 的 小 把 戏 ， 当 然 ， 


理 


频谱 实际 上 是 信号 分 析 领 域 里 的 一 个 专属 概念 , 是 一 段 音频 (或 图 像 ) 数 据 在 频 域内 的 表示 。 


频 域 是 相对 于 时 域 的 一 个 概念 ,在 时 域内 的 信号 ,其 坐标 轴 是 时 间 轴 ,时 域 信号 表示 信号 强度 随 


时 间 变 化 的 情况 。 在 频 域内 的 信号 ， 
对 功率 强度 。 


其 坐标 轴 是 频率 ， 频 域 信号 表示 的 是 信号 在 各 个 频率 上 的 相 


很 多 情况 下 , 信号 的 某 些 特征 在 时 域内 表现 得 并 不 明显 , 但 是 如 果 转 换 到 频 域 , 则 相应 的 特 


征 就 一 目 了 然 了 。 将 时 域 信号 转换 


成 频 域 信号 ， 是 信号 分 析 领 域 里 一 种 常用 的 方法 。 下 面 就 以 


440Hz 的 正弦 波 为 例 ， 通 过 其 在 时 域 和 频 域 内 的 图 像 展 示 ， 理 解 一 下 这 种 转换 的 意义 。 图 15-1a 


是 440Hz 的 正 蓄 波 在 时 域内 的 形态 


， 音 频 采 样 率 是 8000Hz。 图 15-1b 是 其 在 频 域 内 的 形态 ， 理 


想 状 态 下 ， 图 15-1b 应 该 在 440Hz 处 显示 一 条 直线 ， 其 他 位 置 的 值 都 是 0, 但 是 受 原 始 信 号 杂 波 


和 转换 后 的 频 域 分 辩 率 影响 , 实际 
在 440Hz 的 时 候 功率 ( 相对 强度 ) 


显示 的 是 一 个 呈 金 字 塔 形状 的 图 形 , 不 过 还 是 可 以 明显 地 看 到 
值 最 大 ， 其 他 位 置 的 值 都 明显 小 于 440Hz 位 置 的 值 。 
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500Hz 1000Hz 1500Hz 2000Hz 2500Hz 3000Hz 


(a) (b) 


图 15-1 440Hz 正弦 波 在 时 域 和 频 域内 的 形态 


媒体 播放 程序 中 实时 显示 的 频谱 之 所 以 和 正在 播放 的 音乐 匹配 , 是 因为 它 反映 的 就 是 当前 正 
在 播放 的 一 小 段 音频 在 各 个 频段 上 的 强度 ,例如 1 秒 钟 的 音频 数据 如 果 分 成 5 个 Buffer 在 回放 设 
备 上 播放 ， 每 播放 完 一 个 Buffer 后 , 将 这 个 Buffer 的 音频 数据 (通常 是 时 域 信号 ) 转换 成 频 域 数 
据 ， 统 计 出 这 段 数据 在 各 个 频段 上 的 强度 ， 然 后 在 频谱 窗口 中 以 图 形 化 的 方式 体现 出 来 。 这 样 1 
秒 钟 就 可 以 刷新 5 次, 形成 跳动 的 频谱 ,并 与 当前 播放 的 声音 形成 互动 ， 这 就 是 实时 显示 频谱 的 
原理 。 

原理 一 点 都 不 复杂 , 但 是 怎么 将 音频 数据 从 时 域 转换 到 频 域 呢 ? 现在 该 大 名 易 易 的 离散 伟 里 
叶 变 换 ( Discrete Fourier Transform，DFT ) 隆重 登场 了 ! 下 一 节 就 介绍 离散 傅 里 叶 变 换 的 推导 原 
理 和 算法 实现 。 


15.2 ”离散 传 里 叶 变 换 


在 数字 信号 分 析 领 域 里 , 将 信号 转换 成 频 域 信号 的 方法 很 多 , 傅 里 叶 变 换 是 其 中 最 常用 的 一 
种 。 侍 里 叶 变 换算 法 实现 简单 ， 特 别 是 J. W. 库 利 和 了 W. 图 基 在 1965 年 提出 了 快速 傅 里 叶 变换 
算法 (FFT )， 更 是 将 传 里 叶 变换 的 速度 提高 了 千 万 倍 。 快 速 传 里 叶 变换 算法 极 大 地 减少 了 算法 
的 计算 量 ， 推 动 傅 里 叶 变 换算 法 在 各 个 领域 得 到 了 广泛 的 应 用 。 

传统 的 傅 里 叶 变 换 都 是 连续 函数 , 用 于 处 理 无 限 长 度 的 连续 周期 性 时 域 信号 , 但 是 不 适用 于 
计算 机 实现 。 计 算 机 受 存 储 器 的 限制 不 能 处 理 无 限 长 度 的 连续 信号 , 只 能 一 次 一 批 地 处 理 有 限 长 
度 的 离散 信号 ， 这 就 需要 对 信和 号 进行 离散 化 处 理 ， 同 时 建立 对 应 的 离散 信号 传 里 时 变换 。 对 离散 
信和 号 进行 傅 里 叶 变 换 的 方法 就 是 离散 传 里 叶 变 换 。 下 面 就 来 介绍 一 下 离散 傅 里 叶 变 换 的 前 世 今 
生 ， 以 及 快速 传 里 叶 变换 的 原理 和 算法 实现 ， 这 些 是 本 章 要 介绍 的 各 种 应 用 的 基础 。 
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15.2.1 什么 是 传 里 时 变换 


傅 里 时 是 一 位 法 国 数学 家 和 物理 学 家 的 名 字 ， 他 于 1807 年 在 法 国 科 学 学 会 上 发 表 了 一 篇 论 
文 ， 提出 了 一 个 观点 : 任何 连续 周期 信号 可 以 由 一 组 适当 的 正弦 曲线 组 合 而 成 , 换言之 , 满足 一 
定 条 件 的 连续 函数 ( 周期 函数 ) 都 可 以 表示 成 一 系列 三 角 函 数 (正弦 和 /或 余弦 函数 ) 或 者 它们 
的 积分 的 线性 组 合 形式 ， 这 个 转换 就 称 为 傅 里 叶 转 换 。 一 般 情 况 下 , 若 “ 传 里 叶 变 换 ” 一 词 的 前 
面 未 加 任何 限定 语 ， 则 指 的 是 “连续 传 里 叶 变 换 ”， 与 之 对 应 的 自然 就 是 “离散 传 里 叶 变 换 ”。 离 
散 傅 里 叶 变 换 其 实 可 以 看 作 是 “离散 时 间 傅 里 叶 变 换 ”( Discrete-Time Fourier Transform，DTFT ) 
的 一 个 特例 ,离散 时 间 传 里 叶 变 换 在 时 域 是 离散 的 , 但 是 在 频 域 是 连续 的 ， 而 离散 傅 里 叶 变 换 则 
在 时 域 和 频 域 都 以 离散 的 形式 呈现 , 因此 , 离散 傅 里 叶 变换 更 适用 于 所 有 使 用 计算 机 处 理 数 据 的 
场合 。 

离散 传 里 叶 变 换 需 要 对 原始 的 连续 信号 进行 离散 化 , 原始 信号 离散 化 的 过 程 其 实 就 是 以 一 定 
的 采样 周期 对 原始 信号 进行 采样 的 过 程 。 最 典型 的 例子 就 是 脉冲 编码 调制 (Pluse Code 
Modulation， PCM ) 技术 对 音频 信和 号 的 处 理 方式 ， 连 续 的 声音 信号 〈 模拟 信号 )， 通 过 采样 ， 变 
成 一 个 一 个 采样 数据 ( 数字 信号 )。 如 果 采 样 周 期 是 8000Hz， 则 一 秒 钟 的 的 声音 会 变 成 8000 个 
采样 数据 。 计 算 机 系统 回放 设备 播放 的 声音 数据 就 是 使 用 各 种 采样 周期 得 到 的 离散 化 的 PCM 音 
频 ， 频 谱 和 均衡 器 也 都 是 基于 离散 化 的 PCM 数据 进行 处 理 的 。 


15.2.2” 傅 里 时 变换 原理 


要 了 解 离散 传 里 叶 变 换 的 原理 ,首先 要 从 连续 傅 里 叶 变 换 开 始 。 因 为 工程 中 用 的 最 广泛 的 是 
非 周期 信号 ， 所 以 我 们 只 关注 非 周 期 信号 的 处 理 方式 。 非 周期 信号 传 里 叶 变 换 的 基本 思想 就 是 : 
把 非 周期 信号 当成 一 个 周期 无 限 大 的 周期 信号 , 然后 研究 这 个 无 限 大 周期 信号 的 傅 里 叶 转 换 的 极 
限 特征 。 换 名 话说， 就 是 把 你 要 处 理 的 非 周期 信号 看 作 是 一 个 只 有 一 个 周期 的 周期 信号 ,所 有 的 
数据 是 周期 性 的 ， 只 不 过 只 有 一 个 周期 而 已 。 


1. 离散 傅 里 叶 变 换 公式 
先 来 看 看 连续 非 周期 信号 的 传 里 叶 变 换 公式 : 


X(@)=| x(Ne dr (15-1) 
公式 中 的 i 是 虚数 单位 ， 即 =-1。 接 下 来 要 对 连续 傅 里 叶 变 换 离散 化 ， 连 续 傅 里 叶 变 换 中 
的 函数 x(0 是 连续 的 ， 现 在 假设 在 x(0 的 某 一 段 连续 区 间 上 以 周期 了 进行 采样 ， 得 到 NX 个 采样 点 ， 


则 每 个 采样 点 的 离散 傅 里 叶 变换 公式 就 是 : 


| i 
X(OD=>xe n=0,1,.,N-l (15-2) 
k=0 


积分 变 成 了 级 数 求 和 ， 这 就 是 离散 化 的 结果 。 如 果 要 计算 这 段 区 间 上 x() 处 的 传 里 叶 转 换 结 
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果 ， 就 可 以 通过 计算 离散 信号 的 x(n7) 获 得 。 考 察 式 (15-2) 可 知 ， 计 算 N 个 采样 点 的 傅 里 叶 变 换 ， 
需要 计算 次 复数 乘法 运算 和 NN 1 次 复数 加 法 运算 。 趟 (15-2) 中 e 的 指数 项 e 是 个 与 点 数 
N 有 关 的 常量 ， 令 WU,=e”， 则 式 (15-2) 可 简单 记 为 式 (15-3) 所 示 ， 

XW) = Sx n=0,1,.…,N-1 (15-3) 


2. 快速 傅 里 叶 变 换 原 理 推导 


由 于 DFT 算法 计算 量 巨大 ， 限 制 了 DFT 的 应 用 。 长 期 以 来 ， 人们 提出 了 很 多 改进 的 离散 传 
里 叶 变 换算 法 ， 其 中 ,J. W. 库 利 和 工 W. 图 基 发 明 的 快速 传 里 叶 变 换 ( Fast Fourier Transform , 
FFT ) 算法 就 是 使 用 最 广泛 的 一 种 。 在 开始 理解 快速 全 里 叶 变 换 之 前 ， 先 了 解 一 下 式 (15-3) 中 自 
然 对 数 e 的 指数 项 Wy 的 周期 性 和 对 称 性 ，Wn 的 周期 性 可 以 表示 为 : 


We = WO = Wa) (15-4) 


Wn 的 对 称 性 可 以 表示 为 : 


W™ = Wi"™ 三 丽人 十 Wr™®) (15-5) 

快速 傅 里 叶 变 换算 法 的 基本 思想 就 是 利用 以 上 周期 性 和 对 称 性 ， 将 个 点 的 DFT 分 解 成 n 
个 Nn 点 的 DFT, 从 而 显著 地 减少 了 运算 量 。 事实 上 , 这 个 想法 并 不 是 库 利 和 图 基 两 个 人 的 首创 ， 
大 数学 家 高 斯 在 1805 年 就 发 明了 这 种 算法 的 基本 思想 ， 不 过 基 2 的 快速 侍 里 叶 变 换算 法 仍然 以 
这 两 个 人 的 名 字 命 名 ,以 表彰 他 们 对 推广 傅 里 叶 变 换 应 用 所 作 的 贡献 。 有 一 点 值得 说 一 下 ,这 种 
算法 的 思想 是 如 此 优秀 ， 以 至 于 库 利 和 图 基 并 不 是 历史 上 第 一 个 重复 发 明 它 的 人 。 也 许 是 “英雄 
所 见 略 同 ”的 缘故 ， 此 算法 在 历史 上 不 断 被 各 个 研究 领域 的 学 者 们 “重复 发 明 ”。 

现在 就 以 基 2 的 FFT 算 法 为 例 , 介绍 一 下 这 种 分 解 如 何 有 效 地 减少 运算 量 。 如 图 15-2 所 示 ， 
将 NWN 个 点 的 DFT 分解 成 两 个 N/2 个 点 的 DFT， 可 以 将 复数 乘法 的 运算 量 减少 为 YW2。 再 进一步 
分 解 成 四 个 N4 个 点 的 DFT, 复数 乘法 的 计算 量 进一步 减少 为 YV/4。 分 解 过 程 可 以 迭代 进行 , 直 
到 不 能 再 分 解 为 止 (2 个 点 的 DFT )。 


N 点 DFT NY 次 
N72 点 DFT 2 点 DFT XH， 于 MV 次 复数 
有 4 4 2 乘法 
| [El 
Na | [TNA | TNA |[TN4L| N,N NM 入 次 复数 
DFT DFT DFT DFT 16116116116”4 乘法 


图 15-2 ” 基 2 FFT 分解 与 计算 量 


每 次 分 解 ,都 将 原始 信号 x(n) 按 照 时 间 顺 序 ( 也 就 是 n 的 序号 ) 分 成 奇偶 两 个 组 x1(r) 和 x2(7)， 
其 中 +x 与 n 的 关系 是 : 
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当 为 偶数 时 ， 令 n=27; 
当 为 奇数 是 ,， 令 27 + 1; 
也 就 是 说 ， 原 始 信 号 与 两 个 分 组 的 信号 存在 以 下 关系 : 
X27) =x1(7), xQr+1) = x2(7) 其 中 x=0,1,…,N/2-1 (15-6) 
现在 将 式 (15-6) 中 的 关系 代入 到 式 (15-3) 中 ， 将 一 个 入 点 DFT 分 解 为 两 个 N/2 点 DFT: 


Al N/2-1 N21 
X(n) = > x(PW 一 > Xx(2r)W2™” 后 xQr+ DW 
k=0 和 


N/2-1 


= XW + We x re™ (15-7) 
= 2 


因为 WY =e =e WW -不 ， 将 此 递 推 关系 代入 式 (15.7)， 得 到 


X(n)= > XW + WY > Tr, = Xn) + WYX,(n) (15-8) 


式 (15-8) 中 ,入 点 DFT 变换 X(n) 中 的 取 值 范围 是 0,1…,N-1, 周期 为 N, 而 两 个 W2 点 DFT 
变换 久 (n) 和 且 (n) 中 的 取 值 范围 是 0,1…,N/2 - 1， 周 期 为 W2。 因 此 ， 式 (15-8) 只 是 给 出 了 N/2 
点 的 变换 关系 ， 并 没有 将 全 部 NN 个 点 的 X(w) 中 都 求解 出 来 。 要 想 利用 名) 和 总 (四 表达 全 部 的 
X(n) 中 ,还 必须 利用 W 的 周期 性 和 对 称 性 进 ， 找 出 了 (mn)、 怠 (n) 和 Xl(nt+N/2) 的 关系 ， 进一步 推导 
出 后 W2 个 点 的 对 应 关系 。 由 式 (15-4) 的 周期 性 可 知 : 球 '2 2 = WW， 因此 : 


X(N/2+n)= > XW = ) = > XW = Xn) 


同 理 可 得 : XX,(N/2+n)= 了 XX,(n)。 
由 式 (15-8) 推 导 的 分 解 关系 可 知 ， 一 个 W 点 DFT 变换 的 前 N2 个 周期 数据 的 转换 关系 是 : 
X= WX,n) n=0,1,%,N/2-1 (15-9) 
其 后 V2 个 周期 数据 的 转换 关系 是 : 
X(N/2+n)=XN/2+n) +Wo X(N/2+n)= Xn) +Wo "XY,(n) 


由 式 (15-5) 中 Wi 的 对 称 性 可 知 ，WY ?=W2? .We = , 代入 上 式 后 得 到 后 N/2 个 周期 数据 的 
转换 关系 : 


X(N/2+n)= Xn)-WX,(n) n=0,1,…,N/2-l1 (15-10) 


由 式 (15-9) 和 式 (15-10) 可 知 ，N 点 DFT 变换 Xln) 分 解 的 卫 (n) 和 如 (n) 表 ， 通过 如 图 15-3 所 示 的 蝶 
形 运算 关系 ， 建 立 与 Xn) 的 每 个 点 的 映射 关系 。 
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3. 蝶 形 运算 后 的 码 位 倒序 关系 


音频 频谱 和 均衡 器 与 全 里 叶 变 换算 法 


Xi(n) XM HWEX,(n) 
> 
Xa(n) XM -WX,(n) 


图 15-3 ” 蝶 形 运算 关系 图 


由 上 一 节 的 快速 傅 里 叶 变换 原理 推导 过 程 可 知 , FFT 算 法 的 每 一 级 迭代 计算 , 都 是 由 个 输 


入 数据 ( 复数 ) 两 


序列 一 致 ， 在 进行 同形 运算 之 前 ， 


页 分 组 构成 N/2 个 蝶 形 运算 ， 


经 过 蝶 形 运算 后 得 到 N 个 输出 数据 (复数 )。 但 


是 ， 经 过 晃 形 运算 之 后 ， 每 个 数据 的 位 置 都 发 生 了 变化 。 以 8 点 FFT 运算 为 例 ， 图 15-4 显示 了 
蝶 形 运算 后 8 个 点 的 数据 的 位 置 关 系 。 从 图 中 可 以 看 出 , 为 了 保证 蝶 形 运 


去 算 后 输出 的 顺序 与 原始 


需要 对 原始 序列 进行 重新 排序 。FFT 算法 对 这 个 位 置 关系 的 处 


理 有 两 种 方式 ， 一 种 如 图 15-4 所 示 ， 在 开始 蝶 形 运算 之 前 就 对 原始 数据 按照 码 位 关系 进行 排序 ， 


则 计算 后 可 直接 得 到 与 原始 序列 一 致 的 输出 ,这 种 方式 又 称 为 原 位 运算 方式 。 另 一 种 方式 是 直接 
进行 蝶 形 运算 ,然后 按照 码 位 关系 对 运算 后 的 输出 结果 重新 排序 。 


x(0). 
Xx(4) 
Xx(2) 
Xx(6): 
x(1). 
Xx(5). 
Xx(3)* 
Xx(7). 


> 


~ 


图 15-4 8 点 FFT 蝶 形 运 算 位 置 关 系 图 


表 15-1 码 位 倒序 关系 表 


蝶 形 运算 的 码 位 关系 看 起 来 相当 杂乱 , 然而 还 是 有 一 定 的 规律 的 ， 
律 。 仍 以 8 点 FFT 为 例 ， 表 15-1 显示 了 这 种 倒 读 规律 。 


这 个 规律 


就 是 码 位 倒 读 规 


原始 顺序 原始 顺序 二 进 制 码 倒 读 后 的 二 进 制 码 码 位 倒 读 顺序 
0 000 000 0 
1 001 100 4 
2 010 010 2 
3 011 110 6 
4 100 001 1 
5 101 101 5 
6 110 011 3 
7 111 111 7 
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由 此 可 知 ， 原 始 数据 序列 中 的 某 个 数据 ， 经 过 FFT 的 蝶 形 运算 后 的 位 置 ， 可 以 通过 这 个 数 
据 在 原始 数据 序列 中 的 序号 ， 经 过 二 进 制 反 序 后 得 到 。 同 理 ， 经 过 FFT 的 蝶 形 运算 后 的 某 个 数 
据 , 也 可 以 根据 在 转换 后 的 数据 序列 中 的 序号 , 经 过 二 进 制 反 序 后 得 到 对 应 的 数据 在 原始 数据 序 
列 中 的 位 置 。 


15.2.3 ”快速 传 里 叶 变 换算 法 的 实现 


经 过 上 一 节 的 分 析 , 看 似 神秘 的 快速 全 里 叶 变 换算 法 其 实 非 常 简单 。 算法 的 实现 以 分 治 法 为 
策略 ， 递 归 地 将 长 度 为 的 DFT 分 解 为 两 个 长 度 为 N/2 的 DFT。 假 如 转换 数据 的 点 数 NN 是 2 整 
数 血 ， 可 表示 为 NE2“， 则 算法 需要 进行 M 阶 迭代 分 解 ， 每 一 阶 都 有 N/2 个 蝶 形 运算 。 

考察 图 15-3 的 蝶 形 运算 关系 图 ， 每 次 蝶 形 运算 都 要 乘 以 因子 Ws ,而且 每 次 蝶 形 运算 都 会 使 
得 两 个 原始 数据 的 结果 像 被 扭转 了 一 样 变 换 位 置 ， 因 此 这 个 因子 又 称 为 旋转 因子 。 整 个 FFT 算 
法 的 每 一 阶 迭 代 分 解 中 , 旋转 因子 的 个 数 是 不 一 样 的 。 第 一 阶 分 解 为 两 个 W2 的 DFT， 有 一 个 旋 
转 因子 ， 第 二 阶 再 分 解 为 四 个 W4 的 DFT， 有 两 个 旋转 因子 ， 以 此 类 推 。 第 工 阶 迭代 分 解 运 算 的 
旋转 因子 指数 n 的 计算 方法 是 : 


n=j2”* ”(j 是 工 阶 的 第 j 个 旋转 因子 ) (15-11) 


旋转 因子 Wh 是 个 复 指数 ， 在 算法 实现 时 通常 要 分 解 成 正弦 和 余弦 函数 的 分 解 形式 ， 对 于 Wh 的 
分 解 可 表示 为 : 


.2nn 


-i 2 i 
Wy=e ” =cos( a isin( 二 (15-12) 


很 多 FFT 算法 的 实现 通常 事先 计算 好 分 解 式 中 的 正弦 项 和 余弦 项 ， 存 放 在 一 张 数 据 表 中 ， 
在 进行 蝶 形 运算 的 过 程 中 , 通过 查 表 可 以 直接 获取 事先 计算 好 的 值 ， 不 必 每 次 都 计算 ,提高 了 算 
法 效率 。 本 章 要 给 出 的 快速 传 里 叶 变 换算 法 也 采用 了 这 种 方法 ， 在 InitFft() 函 数 中 预先 计算 好 
正弦 项 和 余弦 项 的 值 。 

至 此 ,FFT 算 法 的 全 部 原理 和 细节 都 已 经 介绍 完毕 ,算法 实现 已 经 不 存在 任何 技术 问题 ， 这 
里 给 出 一 个 中 规 中 矩 的 算法 实现 ,完全 对 照 本 章 的 推导 过 程 实现 。 工 业 上 有 很 多 更 高 效 的 算法 实 
现 ， 有 需要 的 读者 可 以 直接 研究 它们 。 

void FFT(FFT HANDLE *hfft, COMPLEX *TD2FD) 


int i,j,k,butterfly,p; 
int power = NumberOfBits(hfft->count); 


/* 蝶 形 运 算 */ 
for(k = 0; k < power; k++) 
{ 


for(j = 0; j < 1<<k; j++) 
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butterfly = 1 << (power-k); 
p= j*# butterfly; 
int s = p + butterfly / 2; 
for(i = 0; i < butterfly/2; i++) 
COMPLEX t = TD2FD[i + p] + TD2FD[i + s]; 
TD2FD[i + s] = (TD2FD[i + p] - TD2FD[i + s]) * hfft->wt[i*(1<<k)]; 
TD2FD[i + p] = t; 
} 
} 


/# 重 新 排序 #/ 
for (k = 0; k < hfft->count; k++) 


{ 


int r = BitReverise(k, power); 
if (r > k) 


COMPLEX t = TD2FD[k]; 
TD2FD[k] = TD2FD[z]; 
TD2FD[ Yt; 


} 
} 
} 


离散 傅 里 叶 转 换算 法 是 基于 复数 的 ， 参 数 TD2FD 是 个 复数 数组 ，COMPLEX 的 定义 如 下 : 


struct COMPLEX 
{ 


float re; 
float im; 


}; 

NumberOfBits() 函 数 根据 点 数 Y 计 算出 2 的 整数 震 M， BitReverise() 函 数 实现 码 序 翻转 。 重新 
排序 的 过 程 中 , 规定 只 有 反 序 后 的 码 序 比 当前 值 大 才 交 换 位 置 , 避免 了 重复 交换 码 序 。FFT_HANDLE 
的 初始 化 主要 是 计算 前 面 介绍 的 正弦 和 余弦 表 和 窗口 函数 表 , 关于 窗口 函数 表 ,， 下 一 节 介 绍 频谱 
应 用 的 时 候 再 介绍 ， 这 里 只 是 给 出 实现 代码 : 

2 InitFft(FFT HANDLE *hfft, int count, int window) 


int i; 


hfft->count = count; 
hfft->win = new float[count]; 
if(hfft->win == NULL) 

{ 


} 
hfft->wt = new COMPLEX[ count]; 


if(hfft->wt == NULL) 
{ 


return false; 


delete[] hfft->win; 
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return false; 
for(i = 0; i «< count; i++) 


hfft->win[i] = float(0.50 - 0.50 * cos(2 * M PI * i / (count - 1))); 
} 


for(i = 0; i «< count; i++) 


float angle = -i * M PI * 2 / count; 
hfft->wt[il].re = cos(angle); 
hfft->wt[il].im = sin(angle); 

} 


return true; 


} 
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一 次 独立 的 离散 傅 里 叶 转 换 只 能 将 有 限 个 数 的 数据 转换 到 频 域 ， 如 果 一 段 音频 数据 比较 长 ， 
需要 进行 多 次 傅 里 叶 变换 , 那么 就 需要 对 转换 后 的 频 域 数据 进行 倒 加 , 才能 计算 出 每 个 频率 上 总 
的 功率 , 也 就 是 频谱 。 所 以 ,在 进行 频谱 计算 之 前 , 我们 首先 介绍 一 下 时 域 信号 转换 成 频 域 信号 
后 有 哪些 特点 ， 以 及 如 何 利用 频 域 数据 进行 分 析 和 计算 。 


15.3.1 ” 频 域 数值 的 特点 分 析 


图 15-1 给 大 家 一 个 频 域 数据 的 抽象 认识 ， 本 节 将 帮助 大 家 更 加 具体 地 认识 频 域 数据 。 前 面 
提 到 过 , 原始 信号 离散 化 的 过 程 其 实 就 是 以 一 定 的 周期 对 原始 信号 进行 采样 的 过 程 ,这 里 就 提 到 
了 一 个 很 重要 的 参数 ， 就 是 采样 率 7。 还 有 一 个 很 重要 的 参数 ， 就 是 每 次 进行 转换 的 时 域 信号 的 
个 数 N ( 也 称 为 离散 传 里 叶 变换 的 点 数 )， 因 为 这 两 个 参数 共同 决定 了 转换 后 频 域 数 值 的 频 域 分 
辩 率 。 

时 域 数据 显示 了 音频 信号 强度 随时 间 变 化 的 趋势 , 横 坐 标 轴 就 是 时 间 , 纵 坐标 轴 就 是 信号 强 
度 。 时 间 坐 标 轴 的 分 辩 率 由 采样 率 7 决定 ， 其 值 为 7 ( VT 就 是 采样 周期 )。 频 域 信号 显示 了 音 
频 信号 强度 随 频 率 变化 的 趋势 ， 横 坐标 轴 是 频率 ， 纵 坐标 轴 是 信号 强度 ( 功率 )。 频 率 坐标 轴 的 
分 状 率 由 时 域 采样 率 了 和 离散 传 里 叶 转 换 点 数 共同 决定 ,其 值 为 YN。 因 为 离散 传 里 叶 转 换 将 
时 域 信 号 一 对 一 的 转换 为 频 域 信号 ， 也 就 是 说 ，N 个 时 域 信号 转换 后 会 得 到 N 个 频 域 信号 ， 这 N 
个 频 域 信号 对 应 的 频率 范围 是 0-T， 所 以 每 个 频 域 信号 的 对 应 的 频段 宽度 是 TI/N。 


离散 传 里 叶 转 换 得 到 N 个 频 域 数据 ， 第 一 个 点 对 应 的 是 频率 为 0Hz 的 信号 强度 ， 也 就 是 音 
频数 据 中 直流 信号 的 强度 。 第 二 个 点 是 频率 TAN Hz 对 应 的 信号 强度 ， 以 此 类 推 , 第 个 点 对 应 
的 是 频率 为 (n-1)T/N Hz 的 信号 强度 。 此 外 ， 频 域 数据 还 有 一 个 特点 ， 就 是 对 称 性 ， 其 前 W2 个 
点 的 数值 和 后 N72 个 点 的 数值 呈现 轴 对 称 特性 ， 所 以 在 计算 功率 谱 时 ， 只 考虑 前 W2 个 点 就 可 
以 了 。 
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15.3.2 ”从 音频 数据 到 功率 频谱 


进行 傅 里 叶 转 换 之 前 ， 要 先 对 音频 数据 进行 处 理 , 将 其 转化 为 算法 支持 的 数据 格式 。 传 里 叶 
转换 是 针对 复数 的 ， 算 法 实现 也 使 用 了 复数 ,但 是 音频 数据 是 实数 ， 因 此， 转化 成 复数 时 只 使 用 
实 部 ， 虚 部 为 0。 

音频 数据 通常 来 自 与 文件 或 声音 采集 设备 ， 常 用 的 音频 信号 格式 是 PCM 编码 。WAVE 文件 
就 是 最 常见 的 音频 文件 格式 ， 其 数据 采用 的 就 是 PCM 编码 ， 数 据 以 一 个 一 个 采样 点 顺序 存放 的 
方式 存储 , 转换 时 只 要 逐个 对 采样 数据 进行 转换 即 可 。 如 果 音 频数 据 包含 多 个 声 轨 ， 比 如 双 声 道 
立体 声 模式 就 包含 左 、 右 两 个 声 轨 的 数据 , 这 种 情况 只 需要 计算 多 个 声 轨 的 平均 值 作为 一 个 采样 
数据 。 具 体 的 转换 算法 如 下 : 


void SampleDataToComplex(short *sampleData, int channels, COMPLEX *cd) 


{ 
if(channels == 1) 
cd->re = float(*sampleData / 32768.0); 
cd->im = 0.0; 
else 
{ 
cd->re = float(*sampleData + *(sampleData + 1) / 65536.0); 
cd->im = 0.0; 
} 
} 


1. 窗 函 数 与 窗口 滑动 

计算 机 不 能 处 理 无 限 长 度 的 数据 ,离散 傅 里 时 变换 算法 只 能 对 数据 一 批 一 批 地 进行 变换 , 每 
次 只 能 对 限时 间 长 度 的 信号 片段 进行 分 析 。 具 体 的 做 法 就 是 从 信号 中 截取 一 段 时 间 的 片段 , 然后 
对 这 个 片段 的 信号 数据 进行 周期 延 拓 处 理 , 得 到 虚拟 的 无 限 长 度 的 信号 , 再 对 这 个 虚拟 的 无 限 长 
度 信 号 进行 信里 叶 变 换 。 但 是 信号 被 按照 时 间 片 截取 成 片段 后 ， 其 频谱 就 会 发 生 畸 变 , 这 种 情况 
也 称 为 频谱 能 量 泄露 。 

为 了 减少 能 量 泄露 ,人们 研究 了 很 多 截断 函数 对 信和 号 进行 截取 操作 , 这 些 截 断 函 数 称 为 窗 函 
数 。 窗 函数 w( 力 被 设计 成 频带 无 限 的 函数 ， 所 以 即使 原始 信号 是 有 限 带宽 信号 ,被 窗 函 数 截取 后 
得 到 的 片段 也 会 变 成 无 限 带 宽 , 也 就 是 说 , 信号 经 过 窗 函 数 处 理 后 ,在 频 域 的 能 量 与 分 布 都 被 扩 
展 了 ， 有 效 地 减少 了 频谱 能 量 泄露 。 

加 窗口 处 理 , 相当 于 对 原始 信号 进行 调制 , 如 下 代码 所 示 ( 原始 数据 的 虚 部 是 0, 不 需要 处 理 ): 

for(int i = 0; i < hfft->count; i++) 

{ 


TF[i].re = TF[i].re * hfft->win[i]; 
} 


不 同 的 窗 函数 对 信号 频谱 的 影响 是 不 一 样 的 。 比 如 最 简单 的 矩形 窗 , 实际 上 就 是 对 信号 不 做 
任何 处 理 , 简单 地 按照 时 间 片 段 截 取 一 定 长 度 的 信号 进行 处 理 。 本 章 做 频谱 计算 时 选用 了 汉 宁 窗 


15.3” 传 里 叶 变 换 与 音频 播放 的 实时 频谱 显示 二 247 


(hanning window )， 汉 宁 窗 的 作用 是 分 析 带 宽 加 宽 ， 但 是 降低 了 频率 分 辨 率 。 汉 宁 窗 的 数学 定义 
如 下 : 


27nt 
N-1l 
其 中 ROD 是 原始 信号 ，t 的 范围 是 0 < 1<N-1， 对 于 其 他 范围 的 值 ，w(?) = 0。 图 15-5 显示 
了 汉 宁 窗 对 信和 号 截取 的 示意 图 ， 以 及 对 频 域 转换 结果 的 影响 。 蓝 色 区 域 是 窗口 覆盖 的 数据 部 分 ， 
白色 区 域 的 数据 将 被 削弱 。 


w(t)= (0.5—0.5cos( 


))R(ID) (15-13) 
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图 15-5 汉 宁 和 窗 信号 截取 示意 图 


使 用 了 窗口 ,就 需要 讨论 窗口 的 滑动 问题 , 也 就 是 窗口 重 闪 的 处 理 。 用 汉 宁 窗 截 取 的 信号 片 
段 ,可 以 看 出 来 窗口 中 部 分 信和 号 被 前 弱 了 ( 造成 衰减 )， 为 了 抵消 部 分 窗口 对 信号 造成 的 衰减 ， 
各 种 窗 函 数 都 需要 对 信号 进行 相应 的 重合 处 理 。 本 节选 择 的 重 县 处 理 方式 是 选取 信号 时 每 次 滑动 
半 个 窗口 位 置 ， 使 得 每 个 窗口 的 后 半 个 窗口 的 衰减 在 下 个 窗口 的 前 半 个 窗口 中 得 到 一 定 的 补偿 。 


2. 计算 功率 频谱 


离散 傅 里 叶 变 换 得 到 的 频 域 数据 是 复数 , 利用 一 些 公式 可 以 根据 实 部 和 虚 部 的 值 推断 出 其 在 
时 域内 的 一 些 特征 ， 比 如 相位 、 时 延 等 ,不 过 我 们 关心 的 是 信号 强度 ,根据 频 域 数据 计算 相对 信 
号 强度 的 计算 公式 是 : 


power = 20.0xlog Ce tne) (15-14) 

计算 一 段 音频 数据 功率 谱 的 算法 非常 简单 , 就 是 从 原始 数据 中 取 NW 个 采样 点 的 数据 , 转换 到 
频 域 , 计算 出 各 个 频率 的 信号 强度 , 然后 从 原始 信号 偏 移 N/2 个 采样 点 位 置 , 再 取 N 个 采样 点 的 
数据 进行 转换 并 计算 信号 强度 , 与 上 一 次 计算 的 值 累加 , 重复 上 述 过 程 , 直到 原始 信号 处 理 完毕 。 
具体 的 算法 实现 如 下 代码 所 示 : 


bool PowerSpectrum(FFT HANDLE *hfft, short *sampleData, int totalSamples, int channels, float *power) 


Eh as Wt by 
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for(i = 0; i < hfft->count; i++) 
power[i] = (float)0.0; 


COMPLEX *inData = new COMPLEX[hfft->count]; 
if(inData == NULL) 
return false; 


int procSamples = 0; 
short *procData = sampleData; 
while((totalSamples - procSamples) >= hfft->count) 


{ 
procData = sampleData + procSamples * channels; 
for(j = 0; j < hfft->count; j++) 
{ 
SampleDataToComplex(procData, channels, &inData[j]); 
procData += channels; 
} 
procSamples += (hfft->count / 2); /* 每 次 向 后 移动 半 个 窗口 */ 
FftwindowFunction(hfft, inData); 
FFT(hfft, inData); 
for(i = 0; i < hfft->count; i++) 
{ 
power[i] += float(20.0 * log10(sqrt(inData[i].re * inData[i].re + inData[i].im * 
inData[i].im) / (hfft->count / 2))); 
} 
} 


delete[] inData; 


return true; 


} 
15.3.3 ”音频 播放 时 实时 频谱 显示 的 例子 


采样 率 为 了 的 音频 数据 经 过 NN 点 FFT 转换 后 ,得 到 N/2 个 有 效 的 频率 和 功率 分 布 ( 另外 N/2 
个 点 的 数据 具有 对 称 性 )。FFT 算法 选择 的 NN 通常 都 比较 大 (一般 都 大 于 512 )， 全 部 显示 这 人 么 
多 点 的 频谱 既 不 现实 ， 也 浪费 资源 。 一 般 频谱 最 多 显示 32 个 波段 (我 用 的 Winamp 2.91 版 本 只 
有 19 个 频谱 波段 )， 这 就 涉及 另 一 个 问题 ， 那 就 是 如 何 从 这 么 多 频率 数据 中 选择 32 个 用 作 频 谱 
的 显示 。 

1. 频率 范围 选择 和 波段 设置 

假如 我 们 有 1024 个 有 效 的 频率 数据 ， 如 何 选择 32 个 数据 组 成 32 段 频谱 显示 ? 选取 的 原则 
是 要 选择 有 代表 性 的 频率 ,两 个 波段 的 中 心 频率 最 好 不 要 相差 太 小 ， 可 以 是 均匀 选择 , 也 可 以 是 
不 均匀 选择 。 可 采用 的 方法 很 多 ， 最 简单 的 方法 就 是 每 隔 32 个 点 选择 一 个 数据 ,刚好 选择 32 个 
点 的 功率 值 ， 然 后 映射 到 32 个 频谱 上 显示 。 还 有 一 个 方法 是 将 1024 个 点 分 成 32 段 ， 每 段 32 个 
点 ， 分 别 计算 每 一 段 的 32 个 点 的 功率 平均 值 ， 然 后 将 32 段 的 功率 平均 值 映射 到 32 个 频谱 上 显 
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示 。 本 章 随后 给 出 的 实例 程序 采用 的 方法 是 将 1024 个 点 分 成 32 段 ， 然 后 找到 每 段 的 中 间 点 ， 从 
中 间 点 向 左 和 向 后 各 取 两 个 点 的 值 ， 共 5 个 值 作为 采样 数据 计算 的 依据 ， 然 后 赋予 不 同 的 权重 ， 
中 间 点 权重 最 高 ， 向 两 边 依 次 降低 ， 然 后 计算 5 个 点 的 加 权 平 均值 , 将 加 权 平 均值 映射 到 频谱 上 
显示 。 


void UpdateSpectrum(short *sampleData, int totalSamples, int channels) 


float power[FFT SIZE]; 
if(PowerSpectrum(&m hFFT, sampleData, totalSamples, channels, power)) 


{ 
int fpFen = FFT SIZE / 2 / BAND COUNT; 


int level[BAND COUNT]; 
for(int i = 0; i < BAND COUNT; i++) 


int centPos = i * fpFen + fpFen / 2; 

double bandTotal = power[centPos - 2] * 0.1 + power[centPos - 1] * 0.15 + power[centPos] 
* 0.5 + power[centPos + 1] * 0.15 + power[centPos + 2] * 0.1; 

evel[i] = (int)(bandTotal + 0.5); 


m SpectrumWnd.SetBandLevel(level, BAND COUNT); 
} 
} 


2. 听觉 与 视觉 延 时 

由 于 声音 和 视觉 信号 在 人 类 的 神经 和 大 脑 之 间 传 导 过 程 存在 差异 ， 会 导致 声音 和 视觉 在 大 
脑 中 的 反应 有 一 个 时 间 差 ， 再 加 上 声 和 光 的 传播 速度 本 身 也 有 很 大 的 差异 ， 因 此 ， 为 了 使 频谱 
显示 能 有 更 好 的 感官 体验 ， 需 要 对 频谱 显示 的 时 机 做 一 些 调整 。 一 般 来 说 ， 应 该 先 将 声音 播放 
出 来 后 再 显示 频谱 ， 这 就 涉及 一 个 问题 ， 即 声音 的 分 段 多 长 比较 合适 。 这 实际 上 是 播放 器 音频 
缓冲 区 大 小 的 选择 问题 ， 缓 冲 区 不 能 太 大 ， 比 如 0.5 秒 以 上 的 音频 缓冲 区 ， 等 播放 完 0.5 秒 后 再 
显示 频谱 ， 视 觉 体验 上 就 觉得 对 不 上 ， 鼓 声 都 响 了 半天 了 频谱 上 才 体 现 出 来 ， 这 种 感觉 肯定 不 
好 。 缓 冲 区 太 小 也 不 好 ,首先 离散 傅 里 叶 转 换 计 算 量 大 ， 需 要 一 定 的 时 间 对 音频 数据 进行 处 理 ， 
缓冲 区 太 小 的 话 就 没有 足够 的 时 间 进 行 计算 , 当然 , 现在 的 CPU 都 很 强劲 , 这 个 不 是 主要 问题 ， 
主要 问题 是 如 果 缓 冲 器 太 小 会 导致 频谱 刷新 太 频 繁 ， 这 使 得 频谱 显示 看 起 来 不 连贯 ， 很 机 械 。 
这 方面 我 也 没有 理论 的 数据 支撑 ， 根 据 实践 经 给， 音频 缓冲 区 大 小 在 0.05 秒 到 0.2 秒 之 间 时 ， 
可 以 取得 比较 好 的 视觉 体验 ， 本 节 给 出 的 例子 程序 使 用 了 0.1s 的 音频 缓冲 区 ， 对 于 我 的 感觉 3 
说 ， 效 果 还 可 以 。 

3. 设计 频谱 显示 器 

频谱 显示 窗口 的 设计 没什么 技术 难度 ， 只 要 熟悉 Windows GDI 编程 ， 实 现 一 个 频谱 窗口 应 
该 没有 问题 。 每 一 个 波段 的 显示 内 容 包含 三 个 部 分 ， 如 图 15-6 所 示 ， 分 别 是 背景 、 当 前 强度 级 
别 和 一 条 缓 缓 落下 的 细 线 (Top_Bar )。 除 了 需要 一 个 列表 记录 当前 各 个 波段 的 强度 级 别 之 外 , 还 
需要 一 个 列表 记录 各 个 波段 的 Top_Bar 的 位 置 , 每 当 一 个 buffer 播 放 完成 以 后 ，UpdateSspectrum() 
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函数 会 计算 出 相应 波段 的 强度 ， 并 刷新 当前 各 个 波段 的 强度 级 别 列表 ， 根 据 选择 的 播放 缓冲 区 
buffer 大 小 ， 刷 新 的 频率 应 该 在 每 秒 5 ~ 10 次 左右 。 与 此 同时 ， 内 部 的 位 置 更 新 定时 需 也 在 周期 
地 减少 各 个 波段 的 强度 级 别 的 值 ， 并 降低 Top_Bar 的 位 置 , 为 了 使 频谱 显示 平滑 一 点 ， 更 新 定时 


器 的 频率 要 大 于 强度 级 别 的 刷新 频率 ， 一 般 应 该 在 每 秒 15 次 以 上 。 


当前 Level 


图 15-6 频谱 显示 的 主要 元 素 


Top_Bar 位 置 和 强度 级 别 的 刷新 就 是 一 个 不 断 减少 的 过 程 ， 但 是 减少 的 方式 不 一 样 。 强 度 级 


个 悬 停 时 间 ， 在 悬 


别 的 减少 可 以 是 一 个 固定 值 ， 每 次 都 减少 一 定 的 数量 。Top_Bar 则 需要 维持 
停 时 间 内 位 置 不 变化 , 悬 停 时 间 结 束 后 ， 其 值 的 减少 是 一 个 逐步 加 快 的 过 程 ， 
减 到 0 之 前 赶 上 强度 级 别 的 位 置 ， 这 样 使 得 频谱 显示 看 起 来 生动 有 趣 。 


并 最 终 在 强度 级 别 


频谱 显示 窗口 是 一 个 需要 高 速 绘图 的 窗口 ， 直 接 使 用 GDI 函数 画 频 谱 窗口 已 经 被 证 明 是 低 


效 的 方法 , 不 推荐 使 用 。 一 般 都 是 采用 位 图 缓冲 区 的 方式 处 理 高 速 刷 新 的 窗 


口 ， 具体 做 法 就 是 在 


一 片 位 图 数据 中 直接 通过 颜色 值 控制 “生成 ”频谱 显示 的 位 图 , 然后 用 贴图 的 GDI 函数 直接 “ 贴 ” 


到 窗口 DC 上 。 


本 书 在 撰写 过 程 中 创建 的 例子 程序 是 一 个 Wave 文件 播放 程序 ,播放 并 显示 一 个 跳动 的 频谱 ， 


外 观 仿 Winamp 的 显示 效果 , 绘制 出 来 的 频谱 形状 比较 接近 Winamp 的 显示 ， 


图 15-7 是 演示 程序 


最 终 的 效果 ， 所 有 的 代码 都 包含 在 本 音 附 带 的 例子 工程 中 ， 读 者 可 自行 研究 。 


虎 频 诺 与 均 征 团 


|EEVworkspace\ 声 音 数据 \adele-Tl Be Waiting.wav 


到 15-7 频谱 显示 示例 程序 
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15.4 破解 电话 号 码 的 小 把 戏 


2012 年 9 月 的 时 候 ,一 个 南京 的 大 学 生 从 电视 台 播 放 的 一 段 记 者 采访 360 总 裁 周 鸿福 的 视频 
中 破解 了 周 鸿 神 的 手机 号 码 , 一 时 被 网 络 热 炒 。 后 来 , 又 听 说 某 人 买 车 的 时 候 使 用 电话 银行 付款 ， 
结果 被 人 录 下 声音 , 破解 了 银行 卡号 和 和 密码， 导致 存款 被 盗 。 故事 情节 就 像 好 莱 声 电影 一 般 充满 
技术 喷头 ,但 是 如 果 说 穿 了 技术 原理 ,恐怕 真 的 没有 什么 技术 含量 。 本 节 就 来 揭示 一 下 这 种 小 把 
戏 的 技术 含量 , 我 的 目的 不 是 教 你 破解 别人 的 电话 号 码 做 坏事 ， 不 过 看 完 本 节 ， 你 应 该 知道 ， 当 
着 一 群 不 怀 好 意 的 人 《他们 手 里 可 能 拿 着 手机 、 录 音 笔 等 各 种 录音 顺 具 ) 之 面 使 用 电话 银行 , 真 
的 是 非常 不 明智 的 行为 。 


15.4.1 拨号 音 的 频谱 分 析 

首先 要 说 一 下 ， 根 据 拨号 音 破解 电话 号 码 只 适用 于 使 用 “ 双 音 多 频 技术 ”( DTMEF ) 的 电话 
设备 ， 老 式 的 拨号 盘 电 话 (脉冲 式 电话 机 ) 不 适用 (估计 你 也 没有 这 玩意 了 )。 前 面 介绍 过 ， 一 
些 在 时 域内 并 不 明显 的 信号 特征 转 到 频 域 以 后 ,其 相应 的 特征 便 一 目 了 然 。 对 拨号 音 的 分 析 , 也 
是 循 着 这 个 思路 ， 首 先 来 看 看 双 音 频 电 话 拨号 音 的 频 域 特征 。 

1. 双 音 频 电 话 拨号 音 

双 音 多 频 技 术 是 贝尔 实验 室 的 发 明 ， 就 是 将 电话 机 的 拨号 键盘 分 成 4x 4 的 矩阵 ， 每 一 行 对 
应 一 个 低频 信号， 每 一 列 对 应 一 个 高 频 信 号 ， 如 图 15-8 所 示 : 


高 频 组 /Hz 
低频 组 /Hz 
1209 1336 1447 1633 
697 1 2 3 A 
770 4 Ss 6 B 
852 7 8 9 CG 
941 . 0 # D 


图 15-8 电话 键盘 双 音 频 对 照 表 

其 中 低频 信号 和 高 频 信号 的 频率 都 在 人 耳 可 以 识别 的 频率 范围 之 内 。 打 电 话 拨号 的 时 候 , 每 按 下 
一 个 键 , 就 产生 一 个 高 频 信 号 和 低频 信号 的 正弦 信号 组 合 , 局 端的 电话 交换 机 从 这 个 组 合 信 号 中 
解 出 两 个 频率 ， 就 知道 是 那个 按键 被 按 下 了 。 

2. 双 音 频 电话 拨号 音频 谱 的 规律 

既然 每 个 拨号 音 都 是 由 一 个 高 频 和 一 个 低频 的 正弦 信和 号 组 合 , 那么 它们 的 频 域 必然 含有 两 个 
能 量 峰 值 , 而 且 这 两 个 能 量 峰值 分 别 位 于 这 一 高 一 低 两 个 频率 点 上 。 这 就 是 双 音 频 电话 拨号 音 的 
频谱 规律 ， 不同 按键 对 应 的 拨号 音 的 区 别 仅仅 就 是 高 、 低 两 个 频率 点 不 同 而 已 。 下 面 以 按键 “1” 
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的 音频 为 例 , 看 看 其 时 域 和 频 域 的 特征 对 比 , 图 15-9 就 是 按键 “1” 的 音频 在 时 域 和 频 域 的 形态 。 


一 


(a) (b) 


图 15-9 按键 “1” 对 应 的 音频 在 时 域 和 频 域 的 形态 


从 图 15-9b 可 以 看 出 ， 虽 然 受 录音 杂 波 影响 很 大 ， 但 是 还 是 可 以 很 明显 看 到 在 697Hz 和 
1209Hz 位 置 上 ， 相 对 能 量 强度 达到 了 最 大 值 。 


15.4.2 ”根据 频谱 数据 反 推 电话 号 码 


了 解 了 电话 拨号 音 的 频谱 特征 , 现在 就 来 分 析 一 下 如 何 根据 频谱 特征 反 推 电 话 号 码 。 如 果 采 
用 N 点 FFT 算 法 ,Powerspectrum() 函 数 可 以 计算 出 W2 个 有 效 的 频谱 数据 (还 记得 对 称 性 吗 ? )， 
这 是 破解 电话 号 码 的 第 一 步 。 对 于 拨号 音 来 说 ,这 N/2 数据 中 有 两 个 极 大 值 ， 分 别 位 于 这 个 拨号 
音 对 应 的 高 音频 率 点 和 低音 频率 点 ,所 以 ,破解 电话 号 码 的 第 二 步 就 是 找 出 这 两 个 极 大 值 点 。 从 
N72 个 数值 中 找 出 最 大 的 2 个， 这 是 个 典型 的 top nn 算法， 可 以 从 互联 网 上 找到 很 多 这 样 的 例子 
代码 , 大 同 小 异 的 点 主要 就 是 对 长 度 为 n 的 有 序 组 的 维护 方法 , 目前 普遍 认为 用 堆 是 最 高 效 的 方 
法 。 不 过 对 于 本 例 的 需求 ，n=2 的 有 序 组 维护 起 来 其 实 很 简单 ， 交 换 两 个 值 就 可 以 保证 有 序 表 有 
序 。 这 里 给 出 一 个 top_2 算法 实现 : 


void ExchangeIndex(int *index, float *power) 


{ 
if(power[index[1]] > power[index[0]]) 
int t = index[0]; 
index[0] = index[1]; 
index[1] = t; 
} 
} 


void SearchMax2FreqIndex(float *power, int count, int& first, int& second) 


{ 


int max2Idx[2] = { 0, 1 }; 
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ExchangeIndex(max2Idx, power); 
for(int i = 2; i «< count; i++) 
{ 


if(power[i] > power[max2Idx[1]]) 


max2Idx[1] = i; 
ExchangeIndex(max2Idx，power); 


} 
first = min(max2Idx[0], max2Idx[1]); 
second = max(max2Idx[0], max2Idx[1]); 
} 
计算 结果 中 first 返回 低频 点 的 位 置 ，second 返回 高 频 点 的 位 置 。 


破解 电话 号 码 的 第 三 步 就 是 根据 两 个 极 大 值 点 的 位 置 , 反 算出 对 应 的 频率 。 根据 15.3.1 节 的 
分 析 ， 转 换 后 的 结果 和 频率 存在 如 下 对 应 关系 : 


Freq=(n-1)TN (nn 是 power 数组 的 位 置 ，7 是 采样 率 ) (15-15) 
由 于 频 域 分 辩 率 的 关系 ， 反 算出 来 的 频率 不 会 刚好 就 是 图 15-8 中 的 值 ， 但 是 应 该 是 非常 接 
近 这 些 值 的 , 可 以 通过 简单 的 查 表 定 位 到 真实 的 频率 值 , 有 了 这 两 个 真实 的 频率 值 ,， 也 就 知道 电 
话 号 码 了 。 
现在 明白 了 吧 ， 只 要 有 一 套 音频 分 析 软 件 ， 就 可 以 对 拨号 音 进行 分 析 ， 并 破解 电话 号 码 。 即 
使 是 编程 实现 ， 也 没有 太 大 的 技术 难度 。 看 来 ， 以 后 打 电 话 的 时 候 ， 还 是 把 拨号 音 关 掉 吧 。 


15.5 “离散 传 里 时 逆 变换 


有 从 时 域 转换 到 频 域 的 方法 ， 就 必然 有 从 频 域 转换 到 时 域 的 方法 ， 相 对 于 离散 傅 里 叶 变 换 ， 
这 个 反 向 转换 就 是 离散 伟 里 叶 逆 变换 ( IDFT )。 和 离散 侍 里 叶 变 换 一 样 ， 离 散 傅 里 叶 逆 变换 也 是 
连续 傅 里 叶 逆 变换 的 离散 形式 ， 先 来 看 看 非 周 期 信号 连续 傅 里 叶 逆 变换 的 公式 : 


x(t) -元 | _X(@e "do (15-16) 


连续 傅 里 叶 北 变换 中 的 函数 XX) 是 频 域 连续 的 ， 现 在 假设 在 儿 @) 的 某 一 段 连续 区 间 上 按照 
频 域 抽取 N 个 频率 ， 得 到 N 个 采样 点 ， 则 每 个 采样 点 的 离散 傅 里 叶 逆 变 换 公 式 就 是 : 


x = Xe 0 (15-17) 
k=0 
如 果 引 入 常量 Wy， 式 (15-17) 可 以 简单 记 为 : 


N-l 
x = XW n=0,1,…,N-1 (15-18) 
k=0 
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15.5.1 ”快速 全 里 叶 逆 变换 的 推导 


对 应 于 前 面 介绍 的 快速 傅 里 叶 变换 ， 也 存在 与 之 对 应 的 快速 傅 里 叶 逆 变换 ( Inverse Fast 
Fourier Transform，IFFT )。 和 快速 发 健 里 叶 变 换算 法 的 推导 过 程 一 样 ， 快 速 傅 里 叶 首 变换 算法 的 
推导 也 是 从 式 (15-18) 开 始 ， 利 用 Wy 的 周期 性 和 对 称 性 ， 将 离散 健 里 叶 首 变换 了 逐 级 分 解 ， 减 少 计 
算 量 。 具体 的 推导 过 程 与 快速 全 里 叶 变 换 类 似 , 读者 可 参考 15.2.2 第 2 小 节 的 过 程 自行 推导 ,此 
处 不 再 歼 述 。 

就 IFFT 算 法 的 实现 而 言 ， 其 过 程 和 FFT 算 法 的 实现 一 样 ， 只 需 对 FFT 算法 稍 作 修改 ， 就 成 
为 了 IFFT 算 法 。 对 比 式 (15-18) 和 式 (15-3)， 可 以 看 出 ,二 者 的 区 别 主 要 有 两 点 : 一 个 是 蝶 形 变换 
的 旋转 因子 不 同 ， 另 一 dt ae a # 打 除 以 N。FFT 算法 的 同形 变换 施 转 因 子 是 
W* ， 而 IFFT 算 法 的 旋转 因子 是 WW”， 除 此 之 外 ， 二 者 蝶 形 变换 的 距离 和 位 置 关 系 都 是 一 样 的 ， 
也 就 是 说 ， 最 终 位 序 重 排 的 方法 也 一 样 。 


15.5.2 ”快速 传 里 时 逆 变 换 的 算法 实现 


快速 傅 里 叶 逆 变换 算法 的 蝶 形 变换 旋转 因子 是 更 ”， 由 式 (15-12) 可 知 , 其 分 解 的 复数 形式 中 
余弦 项 〈 实 部 ) 与 FFT 算法 的 余弦 项 相同 ,正弦 项 ( 虚 部 ) 的 符号 位 与 FFT 算法 的 正弦 项 刚好 
相反 ， 因 此 ， 算 法 实现 仍然 可 以 可 用 FFT_HANDLE 中 的 正弦 项 和 余弦 项 表 。IFFT 的 算法 实现 如 下 : 


void IFFT(FFT HANDLE *hfft, COMPLEX * FD2TD) 
{ 


int i,j,k,butterfly,p; 
int power = NumberOfBits(hfft->count); 


for(k = 0; k < hfft->count; k++) 
FD2TD[k] = FD2TD[k] / COMPLEX(hfft->count, 0.0); 


/* 蝶 形 运 算 */ 
for(k = 0; k < power; k++) 


{ 


for(j = 0; j < 1<<k; j++) 


butterfly = 1 << (power-k); 

p= j*# butterfly; 

int s = p + butterfly / 2; 

for(i = 0; i < butterfly/2; i++) 


COMPLEX t = FD2TD[i + p] + FD2TD[i + s]; 
FD2TD[i + s] = (FD2TD[i + p] - FD2TD[i + s]) * COMPLEX(hfft->wt[i*(1<<k)].re, 
-hfft->wt[i*(1<<k)].im); 
FD2TD[i + p] = 
} 
} 


/*---- 按 照 倒 位 序 重 新 排列 变换 后 信号 ----*/ 
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for (k = 0; k < hfft->count; k++) 
int r = BitReverise(k, power); 
COMPLEX t = FD2TD[k]; 


FD2TD[k] = FD2TD[z]; 
FD2TD[r] = t; 
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调节 均衡 器 改变 声音 的 回放 效果 ， 就 像 在 汤 里 放 味 精 一 样 , 掩盖 了 音乐 原始 的 味道 , 也 能 获 
得 一 些 意 想不到 的 效果 。 但 是 , 同学 ,你 关注 过 它 的 实现 原理 吗 ? 这 一 节 ， 我 们 就 来 研究 一 下 均 
衡器 的 实现 原理 , 同时 结合 前 面 介 绍 的 快速 依 里 叶 变 换 和 快速 傅 里 叶 道 变换, 实现 一 个 可 以 对 各 
种 频率 的 声音 进行 精准 控制 的 频 域 均衡 器 算法 。 

从 应 用 角度 理解 ， 音 乐 均衡 器 有 两 种 常见 类 型 ,一 种 是 图 示 均 衡 右 ( Graphic Equalizer )， 男 
一 种 是 参量 均衡 器 ( Parametric Equalizer )。 图 示 均 衡器 是 一 种 按照 一 定 的 规律 把 全 音频 20 ~ 20000 
Hz 划分 为 若干 的 频段 ， 每 个 频段 对 应 一 个 可 以 对 电 平 进行 增益 或 衰减 的 调节 器 ,可 以 根据 需要 ， 
对 输入 的 音频 信号 按照 特定 的 频段 进行 单独 的 增益 或 衰减 。 参量 均 衡器 不 划分 固定 的 波段 ,可 对 
任意 一 个 频率 点 ( 包括 频 点 附近 指定 频率 带宽 内 的 所 有 点 ) 进行 控制 , 通过 调整 带宽 ,使 得 调节 
控制 可 精确 (小 带宽 )， 也 可 模糊 (大 带宽 )， 非 常 灵 活 。 参 量 均 衡器 操作 控制 不 直观 ， 多 用 在 对 
声音 精确 控制 的 专业 场合 。 像 Winamp 和 Foobar 这 样 的 音频 播放 器 , 多 采用 图 示 均 衡器 , 通过 一 
个 带 调节 器 的 图 形 面板 可 以 让 用 户 很 方便 地 对 特定 频段 进行 调节 。 

从 信号 形态 角度 理解 , 均衡 器 又 可 以 分 为 时 域 均 衡器 和 频 域 均衡 器 两 种 类 型 。 时 域 均衡 器 对 
时 域 音频 信号 通过 共 加 一 系列 滤波 咒 实 现 对 音色 的 改变 , 无 论 是 传统 的 音响 设备 还 是 众多 音乐 播 
放 软 件 , 绝 大 多 数 都 是 使 用 时 域 均衡 器 。 时 域 均衡 器 通常 由 一 系列 二 次 IIR 滤波 器 或 FIR 滤波 器 
串联 组 合 而 成 ,每 个 波段 对 应 一 个 滤波 器 ， 各 个 滤波 器 可 以 单独 调节 ,串联 在 一 起 形成 最 终 的 效 
果 。 但是, 传统 的 IIR 滤波 器 具有 反馈 回路 ,会 出 现 相位 偏差 ， 而 FIR 滤波 器 会 造成 比较 大 的 时 
间 延 迟 。 另 外 ， 如 果 使 用 IR 或 者 FIR 滤波 器 ， 均 衡器 波段 越 多 ， 需 要 串联 的 滤波 器 的 个 数 也 越 
多 , 运算 量 也 越 大 。 频 域 均衡 器 是 在 频 域 内 直接 对 指定 频率 的 音频 信号 进行 增益 或 衰减 ， 从 而 达 
到 改变 音色 的 目的 。 频 域 均衡 器 没有 相位 误差 和 时 间 延 迟 ， 而且 不 固定 波段 ,可 以 对 任意 频率 进 
行 调节 , 不 仅 适 用 于 图 示 均 衡器 , 也 适用 于 参量 均衡 器 。 特别 是 采用 快速 传 里 叶 变 换 这 样 的 算法 ， 
可 以 进行 更 快速 的 运算 ， 即 便 是 多 段 均 衡器 也 不 会 引起 运算 量 的 增加 。 


15.6.1 频 域 均衡 器 的 实现 原理 
总 体 上 说 ， 频 域 均衡 器 的 实现 原理 很 简单 ， 就 是 将 时 域 音频 信和 号 转换 到 频 域 ， 然 后 对 特定 频 
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率 进行 增益 或 衰减 计算 , 最 后 再 将 结果 转换 到 时 域 ， 从 而 实现 对 音频 音色 的 修改 。 如 果 是 多 个 音 
轨 的 音频 , 需要 对 每 个 音 轨 单 独 做 上 述 转换 和 调节 。 原 理 简 单 , 但 是 实现 起 来 并 不 简单 ， 有 很 多 
细节 问题 需要 解决 。 首先， 用 户 在 图 示 均 衡器 上 拉动 拉杆 ,调节 了 某 个 波段 之 后 ,这 个 调节 的 相 
对 变化 如 何 转 化 为 对 频 域 信号 的 处 理 ? 


15.6.2 ” 频 域 信号 的 增益 与 衰减 


图 示 均 衡器 允许 用 户 调节 每 个 波段 的 增益 和 衰减 ， 调 节 的 单位 通常 是 dB (分 贝 )。dB 是 一 
个 相对 比值 ， 用 于 表示 两 个 值 之 间 的 比例 关系 。20 dB 的 信号 的 实际 强度 是 0 dB 信和 号 的 10 倍 ， 
而 -20 dB 的 信号 的 实际 强度 是 0dB 信号 的 1/110。 当 用 户 调节 了 某 个 波段 的 增益 值 后 ， 如 何 将 这 
个 相对 增 量 转换 成 能 在 频 域内 直接 对 频 域 数据 进行 计算 处 理 的 增益 强度 , 是 频 域 均衡 器 需要 解决 
的 重点 问题 。 

1. 频 域 的 增益 和 衰减 

首先 ,增益 或 衰减 是 基于 频率 ( 频段 ) 进行 计算 ， 所 以 这 个 问题 需要 在 频 域内 处 理 。 处 理 的 
方法 就 是 式 (15-14) 所 描述 的 功率 相对 强度 与 频 域 信号 值 的 计算 关系 。 与 处 理 频谱 的 方式 不 同 , 这 
里 要 通过 这 个 公式 反 推 需要 在 频 域 信号 玲 加 什么 值 才 能 使 得 功率 达到 指定 的 增益 或 误 减 。 具 体 来 
说 ， 就 是 频 域 信号 的 实 部 和 虚 部 各 需要 县 加 什么 值 ， 以 及 这 种 琶 加 关系 是 什么 。 

为 了 给 某 个 频率 的 信号 增益 已 个 dB (P; 若 是 小 于 0， 表示 是 对 信号 进行 衰减 )， 根 据 公 式 
(15-14), 需要 芭 加 的 量 是 (x+yi)。 现在 对 x 和 yy 赋予 不 同 的 权重 , 不 妨 设 实 部 的 权重 是 0.75， 虚 部 
的 权重 是 0.25， 也 就 是 令 x=0.75k， j=0.25k。 将 x 和 yy 代入 到 式 (15-14)， 简 化 后 可 以 得 到 . 

Vi0 
Pp 一 20.0 x loen( se) 

对 于 指定 的 增益 (或 衰减 ) 值 已 ,可 以 利用 上 式 计 算出 天 的 值 。 接 下 来 ， 假设 某 个 频率 在 频 

域 的 值 是 (a+bi)， 其 相对 强度 是 Pu， 如 果 给 其 到 加 一 个 增益 〈 或 衰减 ) P.， 需 要 的 计算 是 : 


Va’ +P’ VIi0 
已 + 已 =20.0xlogio( 人 
Got 十 Cy 
= 20.0xlo 
gio( N12 


由 上 式 可 知 ， 需 要 给 原始 信号 进行 又 加 的 值 是 VI0k/2N ， 欠 加 的 方式 是 复数 乘法 。 


前 面 给 出 的 快速 傅 里 叶 变 换 和 逆 变 换 都 是 复数 变换 , 但 是 处 理 音 频数 据 时 都 只 使 用 了 复数 的 
实 部 ( 虚 部 赋值 为 0.0 )， 因 此 ， 肥 加 值 在 频 域 计算 好 之 后 ， 需 要 转换 到 时 域 ， 将 虚 部 清 0， 只 保 
留 实 部 的 值 , 然后 再 转换 到 频 域 , 此 时 的 全 加 值 才 是 最 终 参与 复数 乘法 计算 的 值 。 根据 增益 值 计 
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算 释 加 量 的 算法 实现 如 下 : 
bool UpdateFilter(EQUALIZER HANDLE *hEQ, float *gain, int count) 


if((hEQ->hfft.count / 2) < count) 
return false; 


for(int i = 0; i < hEQ->hfft.count / 2; i++) 


{ 
double dbk = pow(10.0, gain[i]/20.0); 
hEQ->filter[i].re = (float)(dbk * 0.75); 
hEQ->filter[i].im = (float)(dbk * 0.25); 
hEQ->filter[hEQ->hfft.count - 1 - i].re = hEQ->filter[i].re; 
hEQ->filter[hEQ->hfft.count - 1 - i].im = hEQ->filter[i].im; 
} 


IFFT(&hEQ->hfft, hEQ->filter); //to time-domain 

for(int i = 0; i < hEQ->hfft.count; i++) 

{ 
hEQ->filter[il].im = (float)0.0; 


i hEQ->filter); //to freq-domain 
return true; 

} 

算法 中 只 计算 了 前 一 半 的 琶 加 量 , 后 一 半 采 用 的 是 对 称 赋值 ,这 是 由 频 域 信号 的 对 称 性 决定 的 。 

2. 应 用 三 次 样 条 曲线 插值 算法 平滑 增益 与 衰减 

对 均衡 器 调节 ， 对 应 的 是 一 个 波段 ,不 是 一 个 频率 。 因 此 ， 在 频 域 进行 增益 (或 衰减 ) 计算 
时 , 不 应 仅 考虑 一 个 频率 ， 而 应 考虑 以 这 个 频率 为 中 心 的 整个 波段 。 当 然 ， 也 不 是 整个 波段 都 进 
行 相同 的 增益 (或 衰减 ), 最 好 的 方法 是 波段 的 中 心 频率 点 执行 最 大 增益 (或 衰减 )， 然 后 按照 波 
段 带 宽 ， 从 中 心 到 边缘 逐步 降低 增益 (或 衰减 ) 的 值 。 

从 波段 中 心 到 边缘 的 变化 可 以 采用 线性 方式 ， 从 示意 图 看 起 来 就 是 多 条 折线 。 当 然 , 也 可 以 
采用 当前 流行 的 方法 ， 就 是 采用 曲线 插值 的 方法 ,使 示意 图 看 起 来 像 一 条 平滑 的 曲线 。 说 到 曲线 
搬 值 ， 小 伙伴 们 应 该 想到 第 12 章 介 绍 的 三 次 样 条 曲线 拟 合 算法 。 是 的 ， 本 章 的 均衡 器 例子 就 使 
用 三 次 样 条 曲线 插值 算法 ,得 到 一 条 平滑 的 增益 (或 衰减 ) 值 曲线 。 生 活 中 到 处 都 是 算法 ,不 是 
吗 ? 代码 正如 UpdateEqCurve() 函 数 所 示 ，InterpolationX 和 Interpolationy 是 插值 点 的 增益 (或 
衰减 ) 值 ， 对 应 的 是 所 有 波段 的 中 心 点 频率 和 两 个 附加 的 起 始点 和 终点 , 使 用 三 次 样 条 曲线 拟 合 
的 算法 得 到 整 条 曲线 的 值 。 


void UpdateEqCurve() 
{ 


float gain[FFT SIZE/2]; 
SplineFitting eq; 


eq.CalcSpline(InterpolationX, InterpolationY, EQ BAND COUNT + 2, 1, 0.0, 0.0); 
for(int x = 0; x < FFT SIZE/2; x++) 
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{ 
gain[x] = (float)eq.GetValue(x); 


UpdateFilter(8&m hEQ, gain, FFT_SIZE/2); 


15.6.3 ”均衡 器 的 实现 一 一 仿 Foobar 的 18 段 均 衡器 


有 了 以 上 的 分 析 ， 均 衡器 算法 的 实现 就 水 到 渠 成 了 ， 将 音频 数据 按照 FFT 算法 一 次 能 处 理 
的 最 大 数据 分 块 ， 对 每 一 块 音频 数据 用 FFT 算法 将 其 转换 到 频 域 ， 对 信号 进行 计算 ， 然 后 在 用 
IFFT 算法 将 音频 数据 转换 到 时 域 ， 每 一 块 的 处 理 算法 如 下 : 


FFT(&hEQ->hfft, leftData); 
if(channels > 1) 


FFT(&hEQ->hfft, rightData); 
} 


SampleDataMpGain(leftData, rightData, hEQ->hfft.count, channels, hEQ->filter); 
IFFT(&hEQ->hfft, leftData); 
if(channels > 1) 


IFFT(&hEQ->hfft, rightData); 
} 


SampleDataMpGain() 消 数 负责 增益 (或 衰减 ) 的 计算 ， 就 是 将 信号 与 filter 逐个 做 复数 乘法 运 
算 ， 最 终 的 结果 将 在 逆 变 换 后 得 到 的 音频 数据 中 得 到 体现 。 

最 后 需要 注意 的 是 ， 对 信和 号 进行 增益 (或 衰减 ) 计算 可 能 会 导致 信号 超出 合法 值 的 范围 ， 从 
听觉 上 理解 就 是 会 导致 调整 后 的 声音 听 起 来 有 杂音 ， 因 此 需要 在 转换 过 程 中 消除 这 种 现象 。 在 音 
频 处 理 领域 , 有 很 多 专门 的 算法 应 对 这 种 情况 , 很 多 个 人 和 组 织 都 申请 了 很 多 这 样 的 专利 。 如 果 
要 实现 一 个 专业 的 均衡 器 ， 你 需要 研究 这 些 算法 ， 本 章 的 例子 只 是 为 了 演示 用 FFT 算法 实现 频 
域 均衡 器 的 原理 , 所 以 采用 了 一 种 简单 的 处 理 方法 , 就 是 当 有 信号 值 越 界 后 , 简单 调整 成 最 大 值 。 
这 个 调整 在 ComplexToSampleData() 函 数 中 实现 ， 这 个 函数 与 SampleDataToComplex() 函 数 对 应 ， 用 
于 将 调整 后 的 信号 转换 成 PCM 格式 的 音频 数据 。 


void ComplexToSampleData(COMPLEX *cdl, COMPLEX *cdr, int channels, short *sampleData) 
{ 


if(cdl->re > 1.0) 

cdl->re = 1.0; 
if(cdl->re < -1.0) 
cdl->re = -1.0; 


*sampleData = short(cdl->re * 32768.0); 
if(channels != 1) 


{ 


上 


f(cdr->re > 1.0) 
cdr->re = 1.0; 
if(cdr->re < -1.0) 
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cdr->re = -1.0; 
*(sampleData + 1) = short(cdr->re * 32768.0); 
} 
} 


至 此 ， 所 有 的 核心 算法 都 已 经 完成 ,按照 惯例 ， 可 以 做 个 例子 演示 一 下 了 。 是 的 ,来 一 个 仿 
Foobar 的 18 段 均衡 器 吧 ， 顺 带 体 现 一 下 三 次 样 条 曲线 插值 算法 的 价值 。 图 15-10 就 是 演示 程序 ， 
均衡 器 曲线 是 我 随便 调 的 , 没 人 会 这 么 调 均衡 器 吧 ? 完整 的 示例 程序 代码 包含 在 本 章 的 随 书 代码 
中 ， 除 了 算法 核心 代码 之 外 ， 剩 下 的 都 是 常规 的 Windows 编程 ， 请 大 家 自己 研究 吧 。 
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图 15-10 ”一 个 仿 Foobar 的 18 段 均衡 器 的 例子 


15.7 ”总结 


本 章 介 绍 了 离散 传 里 叶 变换 及 其 快速 算法 (FFT ) 的 几 个 应 用 例子 , 都 是 生活 中 常见 的 功能 ， 
背后 隐藏 的 却 是 如 此 简单 的 算法 实现 。 其实 离 散 传 里 叶 变换 在 工业 和 信和 号 处 理 领域 有 非常 广泛 的 
应 用 ,并 不 仅 限 于 本 章 的 例子 。 本 章 给 出 的 算法 不 算 最 高 效 的 算法 实现 ,但 是 中 规 中 和 矩 ， 是 研究 
算法 原理 的 好 例子 ,读者 还 可 以 从 互联 网 上 找到 处 理 实数 的 更 高 效 的 FFT 算法 来 研究 。 我 的 目 
的 是 让 大 家 再 次 了 解 生活 中 隐藏 的 算法 ， 解 除 对 算法 的 神秘 感 ， 不 知道 是 否 达到 了 ? 
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最 优化 问题 永远 是 算法 中 永恒 的 话题 之 一 ， 之 前 我 们 介绍 过 一 些 求 最 优 解 的 常用 算法 ， 比 
如 不 一 定 能 得 到 最 优 解 的 贪心 算法 ,适用 于 多 目标 、 多 阶段 优化 的 动态 规划 算法 ,还 有 理论 上 
万 能 、 但 是 实际 应 用 中 常常 受 问题 规模 限制 的 穷 举 算法 。 这 些 算法 都 是 采用 一 种 确定 或 几乎 确 
定 的 方式 寻找 最 优 解 ， 本 章 我 们 将 介绍 一 种 完全 不 同 的 方式 寻找 最 优 解 ， 那 就 是 充满 随机 性 的 
启发 式 方法 。 这 里 提 到 的 启发 式 方法 和 之 前 介绍 搜索 算法 时 常常 提 到 的 启发 式 搜索 是 两 个 概念 ， 
大 家 不 要 搞 混 了 。 

传统 的 最 优 解 算法 都 是 建立 在 确定 性 基础 上 的 搜索 , 在 搜索 过 程 中 遇 到 一 个 决策 点 时 , 对 于 
选 g 还 是 选 0， 其 结果 是 确定 的 。 比 如 贪 焚 法 ， 就 是 按照 贪 焚 策 略 选择 ， 同 样 的 条 件 下 ， 每 个 决 
策 选 1000 次 结果 都 是 一 样 的 。 随 机 化 算法 就 不 会 有 这 么 确定 的 结果 ， 它 是 一 种 带 启 发 式 的 随机 
搜索 , 但 是 随机 化 算法 并 不 是 闭 着 眼睛 掷 仍 子 , 各 种 随机 化 算法 都 有 与 之 对 应 的 理论 基础 。 此 类 
随机 化 算法 常见 的 有 模拟 退火 算法 、 禁 忌 搜索 、 蚁 群 算法 、 神 经 网 络 ， 当 然 也 包括 本 章 要 介绍 的 
遗传 算法 ( genetic algorithm )。 这 些 模拟 、 演 化 〈 进 化 ) 式 的 启发 式 搜索 算法 的 搜索 过 程 不 依赖 
目标 函数 的 信息 , 非常 适合 一 些 传统 最 优化 方法 难以 解决 的 复杂 问题 或 非 线性 问题 ,在 人 工 智能 、 
自 适 应 控制 、 机 顺 学 习 等 领域 得 到 了 广泛 的 应 用 。 


16.1 ”遗传 算法 的 原理 


达尔 文 (Darwin ) 的 进化 论 讲述 的 是 “ 物 竞 天 择 ， 适 者 生存 ”的 自然 原理 ， 生 物体 通过 自然 
选择 、 基 因 突 变 和 遗传 等 规律 进化 出 适应 环境 变化 的 优良 品种 。 遗 传 算法 就 是 这 样 一 种 借鉴 生物 
体 自然 选择 和 自然 遗传 机 制 的 随机 搜索 算法 , 其 搜索 过 程 就 是 “种 群 ”一 代 一 代 “ 进 化 ”的 过 程 ， 
通过 评估 函数 进行 优胜 劣 汰 的 选择 , 通过 交叉 和 变异 来 模拟 生物 的 进化 。 优 胜 劣 汰 是 这 种 搜索 算 
法 的 核心 ， 根 据 优胜 劣 状 的 策略 不 同 ,算法 最 终 的 效果 也 各 不 相同 。 

遗传 算法 将 问题 的 解 定义 为 进化 对 象 的 个 体 , 对 若干 个 体 组 成 的 种 群 进行 选择 、 交 义 ( 杂交 ) 
和 变异 处 理 ， 每 处 理 一 次 种 群 就 “进化 ”一 代 。 只 要 评估 和 选择 策略 合适 ， 经 过 若干 次 “进化 ” 
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之 后 , 种 群 中 就 会 出 现 比 较 接近 最 优 解 的 个 体 ， 对 应 的 就 是 问题 的 近似 优化 解 。 这 就 是 遗传 算法 
的 原理 ， 接 下 来 我 们 要 详细 介绍 遗传 算法 的 处 理 流程 , 在 这 之 前 ， 先 来 了 解 几 个 与 遗传 算法 有 关 
的 基本 概念 。 


16.1.1 遗传 算法 的 基本 概念 


遗传 算法 是 借鉴 生物 进化 过 程 而 提出 的 一 种 启发 式 搜索 算法 , 因此 在 介绍 遗传 算法 之 前 , 首 
先 要 普及 几 个 基本 的 生物 学 术语 。 

首先 是 基因 ( gene ) 和 染色 体 ( chromosome )， 很 多 介绍 遗传 算法 的 资料 通常 将 这 二 者 混 为 
一 谈 ， 其 实 从 生物 学 角度 看 ， 这 是 两 个 不 同 的 概念 。 基 因 是 一 个 单独 的 遗传 因子 , 包含 一 组 不 能 
青 拆 分 的 生物 学 特征 , 而 染色 体 则 可 以 理解 为 是 一 组 基因 的 组 合 , 如 无 特殊 说 明 , 本 书 用 “基因 ” 
一 词 表 示 参 与 计算 的 遗传 特征 。 

接 下 来 是 种 群 (population ) 和 个 体 (individuals )， 生 物 的 进化 以 群体 的 形式 进行 ， 这 样 的 
一 个 群体 就 称 为 种 群 ,， 种群 中 的 每 个 生物 体 就 是 一 个 个 体 。 种 群 中 的 每 个 个 体 是 相互 联系 ,相互 
影响 的 ， 这 种 联系 影响 着 种 群 的 进化 。 


接 下 来 是 残酷 的 “ 适 者 生存 ”"， 只 有 对 环境 适应 度 高 的 个 体 ， 生 存 能 力 强 ， 繁 入 的 后 代 会 比 
较 多 。 相 反 ， 环境 适 应 度 低 的 个 体 参与 繁殖 的 机 会 比较 少 ， 后 代 会 越 来 越 少 ， 最 后 只 剩 下 强 者 。 

最 后 是 遗传 和 变异 ,下 一 代 个 体会 遗传 上 一 代 个 体 的 部 分 基因 , 使 得 个 体 的 生物 学 特征 能 够 
延续 到 下 一 代 。 但 是 遗传 并 不 是 平稳 的 , 会 有 一 定 的 概率 发 生 基因 突变 , 基因 突变 所 产生 的 新 的 
生物 学 特征 可 能 会 提高 个 体 的 环境 适应 度 , 也 可 能 会 降低 个 体 的 环境 适应 度 。 能 提高 个 体 的 环境 
适应 度 的 突变 基因 通过 适 者 生存 原则 被 种 群 延续 到 下 一 代 。 


生物 通过 繁殖 产生 下 一 代 ， 在 遗传 算法 看 来 ,繁殖 就 是 基因 交 又 ( crossover ) 算法 的 处 理 过 
程 ,将 种 群 中 的 个 体 两 两 进行 部 分 基因 编码 片段 的 互 换 ， 即 可 得 到 下 一 代 的 个 体 。 遗传 算法 中 的 
因 突变 (mutation ) 算法 是 通过 直接 替换 个 体 基 因 中 的 某 个 或 某 几 个 编码 实现 的 ， 也 有 的 算法 
用 直接 生成 一 个 新 的 个 体 ( 相当 于 替换 全 部 基因 编码 ) 来 实现 基因 突变 。 基 因 交 叉 和 基因 突变 
是 遗传 算法 的 重要 步 又 , 但 是 不 能 进行 得 太 频 繁 , 如 果 进 行 得 大 频繁 会 导致 每 一 代 的 基因 差异 
大 , 最终 使 得 算法 无 法 收敛 到 近似 最 优 解 。 基 因 交 又 和 基因 突变 如 果 发 生得 太 少 也 不 行 ， 因 为 
这 样 无 法 保证 种 群 的 多 样 性 , 最 终 使 得 算法 可 能 收敛 到 某 个 局 部 最 优 解 ， 从 而 无 法 得 到 全 局 最 优 
解 。 一 般 遗 传 算法 的 实现 都 会 定义 一 个 基因 交叉 发 生 概率 和 基因 突变 发 生 概率 , 通过 这 两 个 概率 
控制 其 发 生 的 频 度 。 

选择 ( selection ) 也 是 遗传 算法 中 的 重要 算法 之 一 ， 选 择 就 是 根据 个 体 的 适应 度 ， 按 照 一 定 
的 规则 从 上 一 代 种 群 中 选择 一 些 优良 的 个 体 遗 传 到 下 一 代 种 群 中 。 适 应 度 (fitness ) 是 个 体 对 环 
境 的 适应 程度 , 适应 度 低 的 个 体会 被 逐步 淘汰 , 适应 度 高 的 个 体会 越 来 越 多 ,遗传 算法 一 般 都 会 
根据 问题 要 求 设置 一 个 适应 度 函 数 评估 每 个 个 体 的 适应 度 。 


汁 八 涛 港 
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16.1.2 ”遗传 算法 的 处 理 流程 
遗传 算法 的 处 理 流程 就 是 一 种 模拟 计算 的 过 程 ， 如 图 16-1 所 示 。 


初始 化 种 群 


Ud 
种 群 N 代 


图 16-1 遗传 算法 模拟 计算 流程 图 


种 群 从 第 代 到 第 N+1 代 演 化 的 过 程 中 ， 个体 评 价 、 选 择 运算 、 交 又 运 算 和 变异 运算 分 别 
扮演 着 自然 界 生 物 进 化 过 程 中 的 “优胜 劣 汰 ” “交配 繁殖 ”和 “基因 突变 ”所 对 应 的 角色 ， 其 中 
选择 运算 、 交 叉 运 算 和 变异 运算 被 称 为 遗传 算法 的 遗传 算 子 。 
严格 来 说 ， 遗 传 算法 并 不 是 一 个 具体 的 算法 ， 它 代表 的 是 一 种 思想 。 针 对 不 同 问题 ， 基 因 的 
选择 与 编码 、 适 应 度 评 估 函 数 的 设计 以 及 遗传 算 子 的 设计 都 是 各 不 相同 的 。 遗 传 算法 其 实 是 一 种 
非常 简单 的 算法 ， 如 果 你 不 相信 ， 请 看 图 16-1 的 流程 图 ， 全 是 直线 箭头 。 但 是 你 还 是 不 相信 ， 
对 吧 ? 虽然 原理 很 简单 ， 但 是 遇 到 问题 ， 仍 然 无 从 下 手 。 原 因 在 于 有 几 个 问题 还 是 没有 明确 ,， 首 
先 , 基因 是 什么 , 怎么 选择 ,怎么 编码 ”其 次 ,适应 度 评估 函数 如 何 设计 ?最 后 ， 三 个 遗传 算 子 
如 何 设 计 ? 下 面 就 从 这 三 个 方面 介绍 一 下 如 何 设计 针对 具体 问题 的 遗传 算法 。 

1. 基因 的 选择 与 编码 

简单 地 理解 ， 遗 传 算法 中 的 基因 就 是 以 某 种 编码 的 形式 表示 的 实际 问题 的 解 。 确 实 很 简单 ， 
举 个 例子 ， 假 如 要 求解 抛物 线 ) 王 -2x2+x+15 在 [-2.5, 3.0] 区 间 上 的 最 大 值 ， 抛 物 线 函 数 的 自 变量 x 
是 问题 空间 的 解 ， 对 应 遗传 算法 中 的 基因 就 是 x ( -2.5<x<3.0 ) 的 某 种 编码 形式 。 再 比如 本 书 
第 3 章 提 到 的 0-1 背包 问题 ， 包 中 所 选择 的 物品 就 是 问题 空间 的 解 ， 比 如 [0,1,0,1,1,0,0]， 对 应 遗 
传 算 法 的 基因 就 是 用 某 种 编码 形式 存储 的 这 个 [0,1,0,1,1,0,0] 状 态 。 由 此 可 见 ， 针 对 不 同 的 问题 ， 
基因 的 形式 千变万化 ， 也 就 不 难 理解 为 什么 不 存在 一 劳 永 逸 的 全 能 遗传 算法 了 。 

说 到 基因 ， 就 不 能 不 提 基 因 的 编码 ， 基 因 可 能 有 点 抽象 , 但 是 编码 是 具体 的 。 所 谓 编码 ,就 
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是 用 计算 机 能 存储 和 处 理 的 数据 形式 表达 基因 所 代表 的 问题 的 解 。 遗传 算法 首先 要 解决 的 问题 就 
是 基因 的 选择 与 编码 问题 , 如 果 这 个 问题 不 解决 ,遗传 算法 的 三 大 遗传 算 子 的 设计 就 是 空中 楼 阁 。 
因为 遗传 算 子 需要 在 遗传 算法 中 对 基因 进行 选择 、 交 又 和 变异 处 理 , 需要 选择 一 种 合理 的 基因 编 
码 规则 , 才能 使 得 遗传 算 子 可 以 方便 快捷 地 处 理 基 因 的 选择 、 交 义 和 变 异 计算 。 基 因 的 编码 规则 
必须 满足 以 下 三 个 条 件 。 

口 完备 性 : 问题 空间 的 所 有 人 解 在 遗传 算法 中 都 有 编码 值 与 之 对 应 。 

口 健全 性 : 遗传 算法 中 的 每 一 个 编码 值 在 问题 空间 中 也 有 对 应 的 值 。 

口 非 宛 余 性 : 遗传 算法 中 的 编码 值 与 问题 空间 中 的 解 满足 一 一 对 应 关系 。 


遗传 算法 常用 的 基因 编码 方式 有 二 进 制 编码 、 格 雷 编 码 、 符 号 编码 、 属 性 序列 编码 等 方式 ， 
对 于 多 参数 的 最 优化 问题 , 可 用 上 述 方式 对 每 个 参数 进行 编码 ,然后 用 级 联 或 交叉 的 方式 组 合成 
最 终 的 基因 编码 。 二 进 制 编码 方式 是 最 简单 的 编码 方式 ,简单 地 说 ,就 是 直接 使 用 被 选择 为 基因 
的 解 ,， 不 进行 特殊 编码 ,被 选 为 基因 的 解 在 内 存 中 是 二 进 制 形式 存在 。 比 如 求 抛物 线 最 大 值 的 问 
题 , 对 x 不 进行 任何 编码 ,直接 选择 若干 个 在 [-2.5,3.0] 区 间 上 的 随机 数 作为 初始 种 群 ， 遗 传 算 子 
直接 对 种 群 中 的 二 进 制 数据 进 行 基因 的 交叉 和 变异 计算 , 评估 函数 的 设计 也 很 简单 。 二 进 制 编码 
虽然 简单 ， 但 是 从 信息 论 角度 分 析 ， 二 进 制 编码 存在 汉 明 晤 崖 (Hamming Cliff ) 问题 2， 对 基因 
做 很 小 的 交叉 和 变异 ， 得 到 的 结果 却 差 异 巨大 ， 会 使 得 遗传 算法 的 基因 交叉 和 变异 难以 跨越 。 

我 们 常用 的 数字 体系 ,无 论 是 二 进 制 、 十 进 制 还 是 十 六 进 制 ， 每 个 数位 都 是 有 权 位 的 ,同样 
的 数字 1， 放 在 个 位 和 放 在 十 位 上 代表 的 意义 是 不 同 的 。 格 雷 码 ( Gray Encoding ) 则 是 一 种 无 权 
码 ， 其 特点 是 任意 两 个 相 邻 的 格雷 码 之 间 只 有 一 位 不 相同 。 此 外 , 格雷 码 的 最 大 数 和 最 小 数 也 仅 
有 一 位 不 同 。 因 此 它 又 称 为 循环 二 进 制 码 或 反射 二 进 制 码 , 其 循环 和 单 步 的 特性 可 以 消除 随机 取 
数 时 出 现 重大 误差 的 可 能 。 格雷 码 最 初 是 作为 一 种 通信 领域 内 的 可 靠 性 编码 使 用 , 但 是 其 “两 个 
相 邻 的 格雷 码 之 间 只 有 一 位 不 同 ”的 特性 可 用 于 遗传 算法 的 基因 编码 。 格 雷 编 码 连 续 性 好 ,可 避 
免 汉 明 悬 崖 问题 ， 增 强 遗 传 算法 的 局 部 搜索 能 力 。 关 于 格雷 编码 和 二 进 制 编码 之 间 的 转换 方法 ， 
本 章 的 随 书 代 码 中 有 转换 算法 , 请 读者 参考 本 章 最 后 给 出 的 参考 资料 自行 研究 转换 算法 的 原理 和 
实现 。 

对 于 某 些 非 数字 体系 的 问题 ,其 基因 无 法 直接 用 数字 表示 , 这 就 需要 用 一 些 符号 编码 来 表示 
基因 。 举 个 学 生 选 课 问题 的 例子 ， 假 设 有 26 门 课 程 可 供 学 后 选择 ， 每 个 学 后 可 选 4 门 课程 ， 很 
显然 ,学 生 所 选课 程 如 果 作为 运算 的 输入 参数 ,无 法 用 数字 表达 。 但 是 如 果 我 们 定义 英文 字母 A ~ 
Z 分 别 代 表 26 门 课程 ， 则 每 个 学 生 所 选课 程 作为 输入 参数 就 可 以 组 成 符号 编码 ， 比 如 ACEK， 
采用 符号 编码 后 就 可 以 转换 成 遗传 算法 中 的 基因 进行 遗传 算 子 计算 了 。 属性 序列 编码 和 符号 编码 


g 在 信息 论 中 ,， 汉 明 距 离 ( Hamming ) 是 描述 两 条 信息 之 间 相 似 程 度 的 一 个 属性 。 两 个 长 度 相等 的 字符 串 对 应 位 置 
上 的 不 同 字符 的 个 数 就 是 两 个 字符 串 的 汉 明 距离 。 换 句 话 说， 如 果 将 一 个 字符 串通 过 蔡 换 字 符 的 方式 变换 成 另 一 
个 字符 串 ， 需 要 做 替换 的 次 数 就 是 汉 明 距离 。 汉 明 悬 崖 是 二 进 制 编码 的 一 个 缺点 ， 就 是 相 邻 整数 的 二 进 制 代码 之 
间 有 很 大 的 汉 明 距离 ， 使 得 遗传 算法 的 交叉 和 变异 变 得 难以 跨越 。 
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的 处 理 思想 类 似 , 也 是 解决 非 数 字体 系 问题 常用 的 基因 编码 方式 。 如 果 算 法 的 输入 参数 无 法 用 数 
字 直 接 编码 , 但 是 输入 参数 由 若干 个 固定 个 数 的 属性 组 成 , 这 些 属性 变化 就 可 以 代表 不 同 的 输入 
参数 , 在 这 种 情况 下 ， 可 以 为 每 种 属性 设置 编码 ， 然 后 按照 属性 序列 排列 ， 得 到 一 个 用 属性 序列 
编码 表示 的 输入 参数 ， 这 就 是 属性 序列 编码 的 主要 思想 。 以 0-1 背包 问题 为 例 ， 我 们 把 一 次 选择 
完成 后 背包 中 的 物品 作为 问题 的 解 ， 则 这 个 解 无 法 直接 用 数字 进行 编码 , 但 是 观察 这 个 解 ， 发 现 
其 组 成 就 是 7 件 物品 的 选择 状态 ， 我 们 对 每 个 物品 的 选择 状态 编码 ，0 表示 不 选 ，1 表示 选 ， 最 
终 背 包 问 题 的 基因 编码 就 是 类 似 [0,1,0,1,1,0,0] 这 样 的 形式 。 

2. 适应 度 评估 函数 

在 遗传 算法 中 , 适应 度 用 于 衡量 群体 中 每 个 个 体 与 最 优 解 的 接近 程度 , 也 就 是 个 体 基 因 的 优 
良 程度 。 适应 度 高 的 个 体 遗 传 到 下 一 代 的 概率 比较 大 , 而 适应 度 小 的 个 体 遗 传 到 下 一 代 的 概率 比 
较 小 。 计 算 个 体 适 应 度 的 函数 就 是 适应 度 评 估 函 数 或 适应 度 函 数 (fitness function )， 遗 传 算 子 中 
的 选择 算 子 需 要 根据 个 体 的 适应 度 函 数 来 评估 每 个 个 体 遗 传 到 下 一 代 的 概率 , 因此 , 适应 度 评 佑 
函数 的 设计 总 是 和 基因 的 选择 紧密 相关 。 

适应 度 函数 对 个 体 的 评估 过 程 一 般 是 这 样 的 : 首先 对 种 群 中 个 体 的 基因 进行 解码 处 理 , 从 遗 
传 算 法 中 的 基因 编码 转换 到 问题 空间 中 的 数据 表达 形式 ; 其 次 ,根据 问题 空间 中 的 数据 表达 形式 ， 
使 用 问题 空间 的 目标 函数 或 最 优 值 评估 方法 计算 问题 空间 对 应 的 结果 ; 最 后 , 根据 问题 的 类 型 和 
最 优 解 的 形式 ， 按 照 一 定 的 规则 对 计算 的 结果 进行 评估 和 转换 ， 得 到 遗传 算法 中 的 个 体 适 应 度 。 

遗传 算法 中 对 适应 度 函数 的 处 理 有 两 种 方式 , 一 种 是 在 算法 的 执行 过 程 中 始终 使 用 固定 的 适 
应 度 函 数 ， 男 一 种 是 在 算法 的 不 同 阶段 使 用 不 同 的 适应 度 函 数 。 第 一 种 方法 的 算法 处 理 简单 , 但 
是 存在 运算 初期 的 早熟 问题 ( 也 称 未 成 熟 收敛 问题 ) 和 运算 后 期 的 竞争 区 分 度 不 高 的 问题 。 所 谓 
早熟 问题 ， 就 是 在 遗传 运算 的 初期 ， 少 数 个 体 的 适应 度 非 常 高 ( 可 能 是 局 部 最 优 解 )， 这 样 在 遗 
传 过程 中 , 这 些 个 体 在 下 一 代 中 所 占 的 比例 很 高 , 使 得 交叉 和 变异 对 种 群 多 样 性 的 作用 被 严重 降 
低 ,， 种 群 多 样 性 无 法 保证 , 最 终 因 为 局 部 最 优 解 的 存在 而 错过 全 局 最 优 解 。 所 谓 竞争 区 分 度 不 高 
的 问题 ,是 在 遗传 算法 运算 的 后 期 ,此 时 种 群 中 多 数 个 体 的 值 都 已 经 非常 接近 最 优 解 ,它们 之 间 
的 适应 度 非常 接近 , 互相 之 间 的 竞争 力 几 乎 相同 ， 随 机 选择 时 因为 适应 度 几乎 一 样 导致 根据 概率 
选择 的 过 程 变 成 等 概率 的 平均 选择 。 一 旦 出 现 这 种 情况 , 遗传 算法 的 搜索 机 制 实际 上 就 没有 重点 
搜索 区 域 了 ， 变 成 了 随机 的 平均 搜索 ,即便 算法 再 进行 几 千 代 、 几 万 代 模 拟 繁殖 ， 其 结果 也 变化 
不 大 ， 严 重 影响 遗传 算法 的 效率 。 

第 二 种 方法 采用 自 适应 适应 度 函 数 或 可 变 适应 度 函 数 ， 在 遗传 算法 的 不 同 阶段 使 用 不 同 的 
规则 计算 个 体 的 适应 度 ， 规 避 使 用 固定 适应 度 函 数 可 能 面临 的 两 个 问题 。 在 遗传 算法 中 ， 这 种 
方式 称 为 适应 度 尺 度 变 换 (fitness scaling )， 常 见 的 适应 度 尺度 变换 方式 有 线性 尺度 变换 、 乘 方 
( 短 ) 尺度 变换 和 指数 尺度 变换 。 对 于 简单 的 问题 (或 没有 局 部 最 优 解 的 情况 )， 使 用 固定 的 适 
应 度 函 数 即 可 ， 如 果 要 研究 可 变 适 应 度 函 数 在 遗传 算法 中 的 应 用 ， 读 者 可 以 通过 本 章 的 参考 资 
料 自行 研究 。 
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前 面 已 经 介绍 过 , 遗传 算法 是 一 种 随机 搜索 算法 , 遗传 算法 通过 适应 度 函 数控 制 搜索 的 重点 
区 域 ， 如 果 适 应 度 函 数 设计 不 当 ， 有 可 能 找 错 重点 区 域 ， 从 而 错过 最 优 解 。 所 以 ， 遗传 算法 的 适 
应 度 函 数 是 算法 是 否 能 成 功 的 关键 因素 。 

3. 遗传 算 子 的 设计 

选择 算 子 、 交 叉 算 子 和 变异 算 子 被 称 为 遗传 算法 的 三 个 遗传 算 子 。 选 择 算 子 又 称 复制 算 子 ， 
是 遗传 算法 中 保证 优良 基因 传播 的 基本 方式 ， 对 应 的 是 “ 适 者 生存 ”的 群体 进化 现象 。 交 叉 算 子 
对 应 的 是 物种 “繁殖 和 交配 ”产生 的 基因 交换 现象 ， 变 异 算 子 对 应 的 是 “基因 突变 ”这 种 进化 现 
象 ， 交 叉 和 变异 算 子 用 于 产生 新 的 个 体 ， 是 基因 多 样 性 的 保证 。 

选择 算 子 的 作用 就 是 从 群体 中 选 出 比较 适应 环境 的 个 体 复制 (繁殖 ) 到 下 一 代 , 选择 算 子 运 
行 的 基础 是 个 体 的 适应 度 评估 值 , 所 以 选择 算 子 和 适应 度 函 数 直 接 影响 着 遗传 算法 的 性 能 。 根据 
“优胜 劣 汰 ”的 原理 ， 遗 传 算法 的 选择 算 子 都 是 非 均 匀 选 择 的 ， 和 常见 的 选择 策略 有 以 下 几 种 。 

口 比例 选择 ( proportional selection ): 又 称 “ 轮 盘 赌 选择 ”(roulette wheel selection )， 是 一 种 

回放 式 随 机 采样 方法 ， 每 个 个 体 进 入 下 一 代 的 概率 等 于 它 的 适应 度 值 与 整个 种 群 中 个 体 
适应 度 值 总 和 的 比例 。 

口 随机 竞争 选择 ( stochastic tournament ): 又 称 “ 随 机 锦标 赛 选择 "， 每 次 用 比例 选择 方式 从 

群体 中 选择 两 个 或 多 个 个 体 进行 适应 度 竞争 ， 适 应 度 高 的 个 体 被 选中 。 重 复 这 个 过 程 ， 
直到 下 一 代 个 体 选 满 为 止 。 

口 最 佳 保留 选择 : 确切 地 说 ,这 是 和 交叉 算 子 与 变异 算 子 结合 在 一 起 的 一 种 选择 策略 。 首 先 
用 比例 选择 方式 选择 下 一 代 个 体 , 但 是 每 次 都 找 出 上 一 代 中 适应 度 最 高 的 个 体 ， 直接 替换 
到 适应 度 最 差 的 个 体 ， 并 且 这 个 个 体 不 参与 交叉 和 变异 运算 ， 确 保 它 能 遗传 到 下 一 代 。 

口 排序 选择 : 对 群体 中 的 所 有 个 体 按期 适应 度 大 小 进行 排序 ， 根 据 排序 结果 ， 按 照 某 种 规 

则 计算 出 每 个 个 体 被 选中 的 概率 。 

口 确定 式 采 样 选 择 ( deterministic sampling ): 该 策略 能 确保 适应 度 高 的 个 体 100% 被 遗传 到 
下 一 代 。 有 具体 的 方法 是 : 根据 个 体 的 适应 度 计算 群体 中 每 个 个 体 在 下 一 代 中 期 望 的 生存 


数目 ， 计 算 方 法 是 N， -MxR/IYR 。 用 ,的 整数 部 分 确定 对 应 的 个 体 在 下 一 代 种 群 中 


的 生存 数目 ， 对 N, 求 和 得 到 M7= > LN | 。 按 照 V 的 小 数 部 分 对 个 体 进行 排序 ， 接 照 从 


大 到 小 的 顺序 依次 取 前 WM - M' 个 个 体 加 入 到 下 一 代 种 群 〈 每 个 个 体 的 数量 是 W )， 最 终 
得 到 MM 个 下 一 代 种 群 。 
遗传 算法 中 的 交叉 算 子 的 功能 是 将 两 个 个 体 的 基因 的 一 部 分 片段 ( 基因 片段 对 应 的 位 置 相 
同 ) 互相 交换 ， 从 而 产生 两 个 新 的 个 体 。 设计 交 义 算 子 的 算法 , 一般 要 求 既 不 要 太 多 地 破坏 个 体 
基因 中 的 优良 基因 ,又 要 能 够 有 效 地 产生 基因 不 同 的 新 的 个 体 ， 保 证 种 群 的 多 样 性 。 交 叉 算 子 的 
设计 一 般 由 基因 的 编码 方式 决定 , 基本 过 程 就 是 随机 从 群体 中 选择 两 个 个 体 配 对 , 然后 按照 一 定 
的 交叉 规则 交换 对 应 位 置 上 的 基因 片段 。 基 因 交 叉 规则 大 致 可 分 为 以 下 几 类 。 
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口 单 点 交叉 〈one-point crossover ): 在 配对 个 体 的 基因 中 只 随机 选择 一 个 点 ， 以 随机 概率 交 
换 这 个 点 对 应 的 基因 片段 ， 从 而 形成 两 个 新 个 体 。 
口 两 点 交叉 (two-point crossover ) 与 多 点 交叉 (multi-point crossover ): 在 配对 个 体 的 基因 中 
只 随机 选择 两 个 或 多 个 点 ,以 随机 概率 交换 每 个 点 对 应 的 基因 片段 ， 从 而 形成 两 个 新 个 体 。 
口 均匀 交叉 (uniform crossover ): 又 称 为 一 致 交叉， 对 配对 个 体 的 基因 上 的 每 个 点 都 按照 相 
同 的 交叉 概率 交换 其 对 应 的 基因 片段 ， 从 而 形成 两 个 新 个 体 。 
口 算术 交叉 〈arithmetic crossover ): 由 两 个 配对 个 体 的 线性 组 合 而 产生 出 两 个 新 的 个 体 ， 该 
操作 对 象 一 般 是 由 浮 点 数 编码 表示 的 基因 。 

遗传 算法 中 的 变异 算 子 的 功能 是 将 个 体 基因 上 的 某 个 点 对 应 的 基因 片段 替换 成 适合 该 点 的 
其 他 基因 片段 值 ,从 而 产生 一 个 新 的 基因 。 和 生物 学 进化 的 基因 突变 一 样 ， 变 异 在 遗传 算法 中 也 
只 是 产生 新 个 体 的 辅助 手段 , 通常 用 一 个 比较 低 的 概率 控制 变异 发 生 的 频 度 。 变 异 算 子 和 交叉 算 
子 共同 决定 了 遗传 算法 的 搜索 性 能 , 通过 维持 种 群 的 多 样 性 避免 早熟 现象 。 变 异 算 子 主要 解决 两 
个 问题 ， 一 个 是 如 何 确定 变异 的 位 置 ， 另 一 个 是 如 何 进行 基因 变异 。 常 用 的 变异 算 子 类 型 如 下 。 


口 单 点 变异 ( One-point Mutation ): 对 个 体 的 基因 编码 随机 选择 一 个 点 ， 以 随机 概率 进行 变 


异 运算 。 
口 国定 位 置 变异 : 对 个 体 基因 上 的 一 个 或 几 个 固定 位 置 上 的 基因 片段 ， 以 随机 概率 进行 变 
异 运算 。 


口 均匀 变异 〈 一 致 性 变异 ): 对 个 体 基因 上 的 每 个 片段 ， 都 使 用 均匀 分 布 的 随机 数 ， 以 较 小 

的 随机 概率 进行 变异 运算 。 

口 边界 变异 ( Boundary Mutation ): 做 变异 操作 时 , 使 用 基因 编码 规则 定义 的 编码 边界 值 ( 如 
果 有 多 个 边界 值 ， 比 如 同时 有 最 大 值 和 最 小 值 的 情况 ， 则 根据 实现 定好 的 规则 选 一 个 或 
随机 选 一 个 ) 替换 原来 的 基因 片段 。 

口 高 斯 变异 : 基因 变异 的 随机 概率 不 是 平均 分 布 随机 数 或 普通 正 态 分 布 随机 数 ， 而 是 采用 

符合 高 斯 分 布 的 随机 数 生成 器 生成 随机 概率 。 

具体 的 变异 算法 是 与 基因 编码 方式 有 关 的 ,比如 二 进 制 编码 和 浮 点 数 编码 ,直接 将 某 一 位 从 

1 变 成 0, 或 从 0 变 成 1 就 实现 了 变异 。 对 于 符号 编码 的 基因 ， 直 接 将 某 个 位 置 上 的 符号 替换 成 

符合 该 位 置 要 求 的 其 他 符号 即 可 变 成 变异 。 对 于 属性 序列 编码 方式 , 改变 某 个 属性 的 值 也 算是 实 

现 了 变异 。 总 之 ， 变 异 只 是 一 个 抽象 的 要 求 ， 具 体 的 算法 实现 则 千姿百态 。 

4. 遗传 算法 的 运行 参数 
除了 遗传 算 子 和 适应 度 函 数 , 遗传 算法 的 四 个 重要 参数 也 会 影响 结果 的 求解 ,这 四 个 参数 分 

别 是 种 群 大 小 M、 交 叉 概率 已、 变异 概率 Pu, 和 进化 代数 7。 

口 种 群 大 小 M 表示 种 群 中 个 体 的 数量 ， 种 群 的 个 体 数量 决定 了 遗传 算法 的 多 样 性 。M 值 越 

大 ,种 群 的 多 样 性 越 好 , 但 是 会 增加 算法 的 计算 量 ， 降 低 运 行 效率 。 但 是 如 果 M 值 太 小 ， 

会 因为 遗传 多 样 性 降低 而 导致 比较 容易 出 现 早 熟 现 象 。 一 般 建议 M 的 取 值 最 小 为 20。 
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口 交叉 概率 已 决定 了 产生 新 个 体 的 频 度 ， 这 是 保证 种 群 多 样 性 的 关键 参数 之 一 。 交 叉 概 率 
太 小 ， 会 导致 新 个 体 产 生 速 度 慢 ， 影 响 种 群 多 样 性 ， 但 是 交叉 概率 也 不 能 太 大 ， 过 高 的 
交叉 概率 会 使 基因 的 遗传 变 得 不 稳定 ， 优 良 基因 比较 容易 被 破坏 。 一 般 建 议 交 叉 概 率 取 
0.4~ 0.9 之 间 的 值 ，0.8 是 比较 常用 的 值 。 

变异 概率 已, 也 是 影响 群体 多 样 性 的 参数 之 一 。 变 异 概 率 太 小 不 利于 产生 新 个 体 ， 对 种 群 
多 样 性 有 影响 ， 但 是 变异 概率 太 大 也 会 使 基因 的 遗传 变 得 不 稳定 ， 优 良 基因 比较 容易 被 
破坏 。 根 据 遗 传 学 原理 ， 基 因 突 变 是 一 个 小 概率 的 事件 ， 在 遗传 算法 中 ， 变 异 算 子 对 种 
群 的 影响 也 应 该 远 远 小 于 交叉 算 子 。 一 般 建 议 变异 概率 取 值 小 于 0.2。 

进化 代数 了 是 遗传 算法 的 退出 条 件 ， 如 果 7 太 小 ， 会 使 得 遗传 算法 在 种 群 还 没有 进化 成 
熟 就 退出 了 ， 自 然 会 影响 结果 的 准确 性 。 当 然 , 7 也 不 是 越 大 越 好 ， 当 种 群 已 经 接近 最 优 
结果 的 时 候 ， 每 次 进化 所 产生 的 变化 非常 小 了 ， 在 这 种 情况 下 仍然 继续 进化 不 仅 影 响 算 
法 的 效率 ， 对 结果 精度 的 提高 也 没有 太 大 的 帮助 。 一 般 建 议 7 最 小 进化 100 代 。 


16.2 ”遗传 算法 求解 0-1 背包 问题 


本 书 的 第 3 章 介绍 了 0-1 背包 问题 ， 并 给 出 了 使 用 贪 焚 法 求解 0-1 背包 问题 的 算法 ， 除 此 之 
外 , 我 们 知道 这 个 问题 还 可 以 使 用 动态 规划 法 和 穷 举 法 求解 。 本 章 介 绍 了 遗传 算法 ， 当 然 这 个 问 
题 也 可 以 用 遗传 算法 求解 。 这 一 节 我 们 将 介绍 一 种 使 用 遗传 算法 求解 0-1 背包 问题 的 算法 实现 ， 
该 算法 采用 属性 序列 方式 对 基因 编码 , 遗传 算 子 则 使 用 了 比例 选择 模式 、 多 点 交叉 和 均匀 变异 三 
种 方式 实现 ， 虽 然 核心 代码 只 有 60 多 行 ， 但 是 却 实现 了 基本 遗传 算法 的 全 部 要 素 。 


16.2.1 基因 编码 和 种 群 初始 化 


0-1 背包 问题 基因 编码 的 方式 已 经 在 16.1.2 第 1 小 节 简单 介绍 过 了 ， 这 里 我 们 讨论 一 下 具体 
的 编码 实现 。 基 因由 7 件 物品 的 状态 组 成 ，1 表示 装 人 背包 ，0 表示 不 装 入 背包 ， 这 样 一 个 7 元 
组 可 以 用 一 个 数组 表示 。 每 个 个 体 除了 基因 以 外 ,还 有 适应 度 、 选 择 概率 和 积累 选择 概率 。 本 章 
的 算法 给 出 个 体 的 定义 如 下 : 


typedef struct GAType 
人 


口 


口 


int gene[0B]_COUNT]; 
int fitness ; 
double rf; 
double cf; 
}GATYPE; 


种 群 初始 化 就 是 为 每 个 个 体 选择 随机 的 基因 , 这 一 点 可 以 使 用 一 些 0 和 1 的 随机 数 直接 填充 
gene 属性 数组 即 可 。 这 里 需要 说 明 一 下 ,随机 填充 的 基因 ， 也 就 是 物品 的 装 入 状态 并 不 一 定 符合 
问题 要 求 ， 比 如 会 出 现 物品 总 重量 超过 背包 容量 的 问题 。 有 两 个 策略 处 理 这 个 问题 ,一 种 策略 是 
初始 化 种 群 基因 时 判断 这 种 情况 ,保证 每 个 基因 都 是 满足 问题 要 求 的 状态 。 如 果 采 用 这 种 策略 ， 
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在 交叉 算 子 和 变异 算 子 的 设计 时 也 要 考虑 这 种 情况 , 当 新 产生 的 个 体 的 基因 不 符合 问题 要 求 的 时 
候 做 特殊 处 理 。 另 一 种 处 理 策略 是 不 判断 基因 的 非法 状态 ,只 是 在 适应 度 评估 时 对 不 符合 问题 要 
求 的 个 体 给 出 惩罚 性 评估 值 , 使 其 获得 一 个 非常 低 的 选择 概率 , 这 样 的 个 体 在 选择 算 子 的 处 理 过 
程 中 自然 就 被 淘汰 。 第 二 种 策略 需要 特殊 设计 适应 度 函 数 ， 给 出 惩罚 机 制 ， 在 选择 算 子 的 设计 上 
也 要 做 特殊 考虑 ， 但 是 总 体 还 说 还 是 比 第 一 种 策略 简单 ， 所 以 本 章 的 算法 采用 第 二 种 策略 。 


16.2.2 ”适应 度 函 数 


对 于 0-1 背包 问题 ， 其 最 优化 目标 函数 就 是 对 背包 内 装 和 物品 的 价值 进行 评估 ， 取 价值 最 大 
的 那个 结果 ， 当 然 ， 前 提 条 件 是 物品 的 总 重量 不 能 超过 背包 容量 。 因 此 , 我 们 把 适应 度 定 义 为 背 
包 内 装 入 物品 的 总 价值 ,同时 对 非法 状态 给 出 惩罚 性 的 适应 度 。 因 为 物品 的 总 价值 都 是 比较 大 的 
数值 ( 最 小 值 是 10 )， 所 以 惩罚 策略 就 是 将 非法 状态 的 个 体 的 适应 度 评价 为 1。 当 然 还 可 以 用 更 
小 的 值 , 但 是 仁慈 一 点 吧 ， 对 选择 概率 来 说 ， 这 已 经 足够 小 了 。 


int EnvaluateFitness(GATYPE *pop) 
{ 


int totalFitness = 0; 

for(int i = 0; i «< POPULATION SIZE; i++) 
{ 
int tw = 0; 

pop[il].fitness = 0; 

for(int j = 0; j < 0BJ COUNT; j++) 


if(pop[i]l.gene[j] == 1) 
{ 
tw += Weight[j]; 
pop[i].fitness += Value[j]; 
} 
if(tw > CAPACITY) /#* 惩 罚 性 措施 */ 
{ 
pop[i].fitness = 1; 


totalFitness += pop[i].fitness; 


} 
return totalFfitness; 
} 
EnvaluateFitness() 孙 数 是 适应 度 评估 也 数 的 实现 ，totalFitness 变量 用 于 计算 种 群 中 全 部 个 
体 的 适应 度 总 和 , 在 这 个 函数 中 计算 种 群 的 适应 度 总 和 是 因为 选择 算 子 需要 计算 选择 概率 。 除 此 
之 外 ， 这 个 函数 的 实现 就 是 上 述 适应 度 函 数 讨论 的 内 容 ， 无 需 过 多 说 明 。 


16.2.3 ”选择 算 子 设计 与 轮 盘 赌 算法 


选择 算 子 的 设计 采用 比例 选择 方法 , 也 就 是 轮 盘 赌 选择 方法 。 轮 盘 赌 算法 是 随机 算法 中 最 常 
用 的 一 种 概率 选择 算法 , 因原 理 和 赌场 中 的 轮 盘 赌 原 理 相 似 而 得 名 。 每 个 个 体 被 选择 的 概率 就 像 
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轮 盘 上 的 一 个 扇 区 , 面积 大 的 扇 区 被 选中 的 概率 就 比较 大 , 面积 小 的 扇 区 被 选中 的 概率 就 比较 小 。 
轮 盘 赌 算法 首先 需要 计算 出 每 个 个 体 的 选择 概率 , 这 个 概率 通常 用 个 体 的 适应 度 与 种 群 的 总 体 适 
应 度 之 和 的 比值 来 计算 。 显 然 ， 对 于 适应 度 大 的 个 体 来 说 ， 这 个 比值 就 比较 大 ,意味 着 其 被 选中 
的 概率 就 比较 高 ， 这 体现 了 根据 适应 度 评估 优胜 劣 汰 的 原则 。 

传统 的 轮 盘 赌 算法 需要 根据 种 群 的 适应 度 总 和 确定 转盘 的 格式 总 数 , 然后 根据 选择 概率 确定 
每 个 个 体 对 应 的 格子 , 最 后 随机 产生 一 个 转动 格子 的 数量 , 由 这 个 随机 数 加 上 当前 转 轮 的 起 始 位 
置 得 到 最 终 对 应 的 格子 数 ， 从 而 确定 该 格子 对 应 的 个 体 被 选中 。 除了 直接 使 用 上 述 方法 实现 轮 盘 
赌 算法 , 还 可 以 用 一 种 比较 简单 的 方法 模拟 轮 盘 赌 算 法 ,在 介绍 这 种 方法 之 前 ， 先 介绍 一 下 什么 
是 积累 概率 。 

某 个 个 体 对 应 的 积累 概率 定义 为 该 个 体 的 选择 概率 和 前 一 个 个 体 的 积累 概率 的 和 , 显然 这 是 
一 个 递归 定义 , 如 图 16-2 所 示 , 假如 某 种 群 中 有 8 个 个 体 , 每 个 个 体 的 选择 概率 分 别 是 0.1、0.2、 
0.15、0.25、0.05 和 0.25， 则 它们 的 积累 概率 分 别 是 0.1、0.3、0.45、0.7、0.75 和 1。 


0.1 02 0.15 025 ”0.05 ”0.25 ”选择 概率 
0 

E33 的 由 EE 入 看 ] 

0 041 0.3 0.45 07 -075 1 积累 概 闪 


@ 
随机 概率 P=0.53 


图 16-2 积累 概率 与 选择 概率 的 关系 


假如 选择 算法 随机 产生 概率 P=0.53， 根 据 积累 概率 关系 : 0.45 <P<0.7， 于 是 第 四 个 个 体 被 
选中 。 

在 开始 随机 选择 之 前 , 种 群 中 个 体 的 选择 概率 和 积累 概率 需要 事先 计算 出 来 , 计算 的 依据 就 
是 适应 度 函数 给 出 的 适应 度 评估 值 和 种 群 的 适应 度 总 和 : 


double lastCf = 0.0; 
// 计 算 个 体 的 选择 概率 和 累积 概率 
for(i = 0; i < POPULATION SIZE; i++) 


{ 
pop[i].rf = (double)pop[il].fitness / totalFitness; 
pop[i].cf = lastCf + pop[i].rf; 
lastCf = pop[il].cf; 

} 


轮 盘 赌 模 拟 算 法 每 次 生成 一 个 在 0 和 1 之 间 的 随机 数 ， 然 后 与 个 体 的 积累 概率 比较 ,确定 随 
机 数位 于 哪个 个 体 的 积累 概率 区 间 就 选择 哪个 个 体 , 如 果 随 机 数 小 于 第 一 个 个 体 的 积累 概率 , 则 
选择 第 一 个 个 体 。 具 体 的 选择 算法 如 下 : 


for(i = 0; i < POPULATION _ SIZE; i++) 


double p = (double)rand() / (RAND MAX + 1); 
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if(p <« pop[0].cf) 
{ 


newPop[i] = pop[o]; 


} 
else 
{ 
for(int j = 0; j < POPULATION SIZE; j++) 
if((p >= pop[j].cf) 8&8& (p < pop[j + 1].cf)) 
{ 
newPop[i] = pop[j + 1]; 
} 
} 
} 


} 

pop 是 当前 种 群 ，newpop 是 经 过 选择 的 下 一 代 种 群 ， 至 此 ， 选 择 算 子 的 算法 实现 就 介绍 完了 ， 
接 下 来 介绍 交 又 算 子 的 算法 实现 。 
16.2.4 ”交叉 算 子 设计 

交叉 算 子 采 用 的 是 多 点 交叉 的 策略 , 对 两 个 随机 选中 的 个 体 的 基因 进行 交换 , 基因 交换 的 位 
置 和 个 数 都 是 随机 选择 ,使 得 新 个 体 的 基因 更 具 随 机 性 。 交 叉 选 择 受 交叉 概率 的 控制 ， 对 种 群 中 
的 每 个 个 体 生成 一 个 0~1 的 随机 数 ， 判 断 这 个 随机 数 是 否 小 于 交叉 概率 ， 当 小 于 交叉 概率 时 ， 
则 选择 这 个 个 体 参与 基因 交叉 运算 。 个 体 选 择 的 算法 如 下 : 


void Crossover(GATYPE *pop) 


! int first = -1;// 第 一 个 个 体 已 经 选择 的 标识 
for(int i = 0; i < POPULATION SIZE; i++) 
| double p = (double)rand() / (RAND MAX + 1); 
if(p < P_XOVER) 
{ 
if(first < 0) 
first = i; // 选 择 第 一 个 个 体 
F 
else 
{ 
ExchangeOver(pop, first, i); 
first = -1;// 清 除 第 一 个 个 体 的 选择 标识 
} 
} 
} 


} 

first 变量 是 一 个 标识 ， 用 于 判断 是 否 已 经 选择 过 一 个 个 体 ，P_x0VER 是 交叉 概率 。 交 叉 算法 
每 选择 两 个 个 体 后 , 就 调用 Exchange0ver() 函数 进行 基因 交换 。Exchange0ver() 函 数 首先 选择 一 个 
1~7 的 随机 数 作为 基因 交换 的 位 数 ， 然 后 对 基因 的 每 一 位 进行 平均 概率 交换 。 正 如 你 看 到 的 那 
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样 ， 交 又 算法 对 基因 交换 后 的 合法 性 没有 判断 ， 这 个 工作 已 经 由 适应 度 评估 函数 和 选择 算 子 
代劳 。 


void ExchangeOver(GATYPE *pop, int first, int second) 


/* 对 随机 个 数 的 基因 位 进行 交换 */ 

int ecc = rand() % 0B] COUNT + 1; 

for(int i = 0; i < ecc; i++) 

{ 
/* 每 个 位 置 被 交换 的 概率 是 相等 的 */ 
int idx = rand() % OBJ COUNT; 
int tg = pop[first].gene[idx]; 
pop[first].gene[idx] = pop[second].gene[idx]; 
pop[second].gene[idx] = tg; 

} 


} 
16.2.5 ”变异 算 子 设计 


变异 算 子 采 用 的 是 均匀 变异 的 策略 ,对 基因 编码 的 每 一 位 以 平均 分 布 的 概率 进行 选择 。 当然， 
异 算 子 受 变异 概率 的 控制 ， 以 较 低 的 概率 选择 进行 变异 的 个 体 : 


void Mutation(GATYPE *pop) 
{ 


渤 


for(int i = 0; i < POPULATION SIZE; i++) 


double p = (double)rand() / (RAND MAX + 1); 
if(p < P_MUTATION) 


{ 


ReverseGene(pop, i); 


} 

} 

P_MUTATION 是 变异 概率 ， 只 有 随机 数 小 于 变异 概率 时 ， 才 调用 ReverseGene() 函 数 进行 基因 的 
变异 处 理 。ReverseGene() 函 数 首先 选择 一 个 1 ~7 的 随机 数 作为 基因 变异 的 变异 点 个 数 ， 然 后 使 
用 一 个 均匀 分 布 的 随机 数 决定 对 基因 中 的 哪些 位 进行 变异 。 对 于 本 例 的 基因 编码 , 变异 的 方法 就 
是 1 变 成 0，0 变 成 1。 以 下 就 是 ReverseGene() 函 数 的 实现 代码 : 


void ReverseGene(GATYPE *pop, int index) 


/# 对 随机 个 数 的 基因 位 进行 变异 */ 
int mcc = rand() % 0B] COUNT + 1; 
for(int i = 0; i < mcc; i++) 


{ 
/* 每 个 位 置 被 交换 的 概率 是 相等 的 */ 
int gi = rand() % 0BJ COUNT; 
pop[index].gene[gil = 1 - pop[index].gene[gi]; 
} 


} 
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16.2.6 ”这 就 是 遗传 算法 
现在 回顾 一 下 图 16-1, 流程 图 中 所 有 的 遗传 算法 关键 元 素 都 已 经 具备 了 , 现在 是 展示 遗传 算 
法 的 真面目 的 时 候 了 ， 下 面 就 是 遗传 算法 的 主体 代码 : 


GATYPE population[POPULATION SIZE + 1] = { 0 }; 
Initialize(population); 


int totalFitness = EnvaluateFitness(population); 

for(int i = 0; i < MAX GENERATIONS; i++) 

{ 
Select(totalFfitness, population); 
Crossover(population); 
Mutation(population); 
totalFitness = EnvaluateFitness(population); 

Initialize() 函 数 负 责 种 群 基因 初始 化 ， 很 简单 ， 就 是 生成 一 些 随 机 数 。 将 适应 度 评估 函数 


和 三 个 遗传 算 子 的 实现 按照 图 16-1 的 流程 图 组 织 起 来 , 就 是 遗传 算法 。 当 主体 代码 中 的 for 循环 
结束 以 后 ， 种 群 population 中 适应 度 最 高 的 那个 个 体 就 是 遗传 算法 的 解 。 根 据 基 因 编 码 的 规则 ， 
解码 出 背包 问题 的 物品 选择 状态 即 可 得 到 问题 空间 的 解 。 

将 第 3 章 介绍 的 背包 问题 的 数据 代 和 人 遗传 算法 中 ， 种 群 大 小 取 值 为 32， 进 化 代数 了 取 值 为 
500， 交 叉 概 率 已 取 值 为 0.8， 变 异 概率 P; 取 值 为 0.15。 运 行 算法 得 到 最 终 种 群 中 最 好 的 结果 是 
适应 度 为 170 的 个 体 (不 止 一 个 ), 其 基因 编码 是 [1,1,0,1,0,1,1], 转换 成 问题 空间 的 解 就 是 背包 中 
选择 编号 为 1、2、4、6、7 的 物品 ， 能 获得 最 大 价值 是 170， 这 和 我 们 用 其 他 算法 得 到 的 最 优 结 
果 完 全 一 致 。 


16.3 总 结 


遗传 算法 是 一 种 带 启 发 性 的 随机 搜索 算法 , 它 不 像 传统 的 搜索 算法 那样 ,从 单个 值 开始 迭代 
搜索 , 按照 特定 的 搜索 顺序 对 整个 解 空间 进行 遍历 。 遗传 算法 的 优点 就 是 一 开始 就 从 一 大 群 解 中 
开始 搜索 ,覆盖 区 域 大 ， 有 利于 找到 全 局 最 优 解 。 
遗传 算法 通过 基因 的 变化 隐 含 地 对 解 空间 的 一 部 分 重点 区 域 进行 搜索 , 从 问题 的 多 个 解 开始 
并 行 搜索 , 对 重点 区 域 的 选择 是 通过 适应 度 函 数 和 选择 算 子 的 运算 来 实现 的 , 这 也 是 启发 性 的 体 
现 。 所 以 , 不 要 对 遗传 算法 过 分 崇拜 ， 这 只 是 一 种 搜索 算法 而 已 ， 只 是 比 漫 无 目的 的 穷 举 搜索 算 
法 “聪明 ”那么 一 点 而 已 , 通过 较 小 的 计算 量 获得 较 大 的 收益 。 也 不 要 以 为 遗传 算法 是 高 效 算法 ， 
只 要 能 用 解析 的 方法 直接 得 到 最 优 解 的 问题 , 都 不 要 试图 用 遗传 算法 ,因为 它 比 穷 举 搜索 高 明 不 
了 多 少 。 

轮 盘 赌 算法 是 各 种 随机 化 算法 中 常用 的 随机 选择 算法 , 原理 简单 ,实现 也 简单 , 但 是 也 存在 
致命 的 问题 。 假 如 一 些 选择 概率 非常 小 的 个 体 连 续 出 现 ， 就 会 导致 它们 集中 在 一 起 在 “ 赌 轮 ” 上 
占据 一 块 很 大 的 扇 区 , 那么 这 块 扇 区 就 比较 容易 被 选中 , 但 实际 上 选择 的 都 是 选择 概率 非常 小 的 


16.4 参考 资料 二 273 


个 体 ， 这 也 是 轮 盘 赌 算法 选择 误差 比较 大 的 原因 ， 在 设计 算法 的 时 候 需 要 注意 这 一 点 。 

本 章 给 出 的 算法 是 遗传 算法 的 一 种 极其 简单 的 实现 , 但 是 麻 淮 虽 小 , 五 脏 俱全 ,可 以 作为 今 
后 更 复杂 的 遗传 算法 设计 的 基础 。 我 对 这 个 算法 做 了 一 些 评估 ， 每 批 进行 500 次 遗传 算法 模拟 ， 
连续 进行 多 个 批 次 ， 发 现 当 进化 代数 了 取 100 时 ， 每 批 次 平均 有 450 ~ 460 次 模拟 算法 能 得 到 最 
优 解 ; 当 了 取 200 时 ， 每 批 次 平均 有 480 ~ 490 次 模拟 算法 能 得 到 最 优 解 ; 当 7 取 500 时 ， 每 批 
次 能 得 到 最 优 解 的 次 数 平均 超过 495 次 。 对 于 这 几 十 行 代码 来 说 ,结果 还 不 错 ， 当 然 ， 它 还 有 进 
一 步 优化 的 余地 ， 有 兴趣 的 读者 自己 动手 吧 。 
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第 7 TV 章 
计算 器 程序 己 大 整数 计算 


几乎 每 个 学 习 编 程 的 同学 都 写 过 计算 器 程序 ， 有 可 能 是 老师 布置 的 作业 ， 也 有 可 能 是 自己 
的 兴趣 ， 总 之 ， 都 会 有 一 个 自己 版 本 的 计算 器 程序 。 不 管 是 只 支持 加 减 乘除 四 则 运算 的 简单 程 
序 ， 还 是 支持 括号 、 对 数 和 乘 方 计算 的 复杂 程序 ， 都 会 面临 一 个 问题 ， 就 是 字 长 问题 。 简 单 地 
说 ，32 位 的 整数 计算 最 大 结果 只 能 表示 到 4294967295 ， 两 个 超过 65535 的 数字 相 乘 就 会 溢出 。 
但 是 Windows 的 计算 器 程序 却 能 超过 这 个 限制 ， 这 很 令 人 诅 丧 ， 但 是 这 背后 的 秘密 其 实 就 是 大 
整数 计算 。 


17.1 哦 ， 溢 出 了 ， 出 洋 相 的 计算 器 程序 


我 记得 我 写 的 第 一 个 计算 器 程序 。 我 花 了 一 晚上 的 时 间 , 还 引入 了 逆 波 兰 表 达 式 ， 支 持 带 括 

号 的 四 则 运算 。 我 向 同学 们 炫耀 这 个 成 果 ， 其 中 一 个 同学 输入 了 两 个 数 相 乘 ， 结 果 我 的 程序 可 耻 
地 打印 出 了 一 个 不 着 边际 的 负数 。 我 很 快 找到 了 问题 的 原因 , 用 C 语 言 的 int 类 型 能 表示 的 最 大 
整数 是 2147483647， 这 个 结果 显然 是 溢出 了 。 于 是 我 很 快 修改 了 程序 , 用 double 代替 int， 暂 时 
解决 了 整数 计算 溢出 问题 。 但 是 很 快 , 我 的 同学 就 发 现 , 我 的 计算 右 计 算 的 结果 和 科学 计算 器 计 
算 的 结果 有 偏差 。 无 论 我 怎么 调整 代码 ， 结 果 总 是 不 准确 ， 最 后 我 只 好 放弃 了 。 
后 来 我 研究 了 一 下 double 类 型 浮 点 数 的 定义 ， 才 明白 是 浮 点 数 有 效 数 字 不 足 造 成 的 结果 不 
准确 。IEEE 定义 double 类 型 的 浮 点 数 , 是 1 个 符号 标志 位 , 11 个 指数 位 (包括 一 个 指数 符号 位 )， 
另外 52 位 是 有 效 数字 。52 位 二 进 制 有 效 数字 ,从 十 进 制 表示 也 就 是 14 ~ 15 位 数字 , 再 长 的 数字 
就 不 能 表示 了 。 也 就 是 说 从 数据 输入 时 就 被 截断 了 ， 结 果 自 然 就 不 准确 了 。 

要 提供 更 大 范围 的 整数 计算 , 或 提供 更 高 的 计算 精度 , 原生 的 数据 类 型 肯定 不 能 满足 要 求 了 ， 
必须 使 用 大 整数 计算 。 比 如 圆周 率 r， 平 常数 学 计算 可 能 小 数 点 后 精确 到 六 七 位 就 足够 了 ， 但 是 
对 于 天 文 计算 , 必须 精确 到 上 万 位 , 或 者 更 高 的 精度 ,否则 计算 几 十 亿 光 年 外 的 星系 的 运行 轨迹 
就 会 产生 很 大 的 误差 。 本 章 就 来 简单 介绍 一 下 大 数 计算 的 原理 , 并 给 出 大 数 的 加 减 乘 除 四 则 运算 、 
乘 方 和 求 余 的 算法 实现 。 这 些 算法 在 第 18 章 介绍 RSA 算法 时 也 会 用 到 。 
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17.2 ”大 整数 计算 的 原理 


任何 一 本 关于 计算 机 组 成 原理 的 书 都 会 介绍 计算 机 处 理 加 减 乘 除 运 算 的 原理 , 以 及 运算 器 的 
实现 方法 。 大 数 计算 的 方法 也 是 采用 这 些 原理 , 只 不 过 不 是 使 用 逻辑 电路 实现 各 种 运算 器 。 同 时 ， 
大 数 计算 也 会 根据 自身 的 特点 , 利用 竖 式 手工 计算 的 一 些 方 法 , 用 程序 的 方式 在 计算 机 中 模拟 这 
些 方法 ， 实 现 大 数 计 算 。 

在 开始 介绍 算法 原理 之 前 ， 先 要 确定 大 数 的 存储 方式 ， 也 就 是 大 数 在 计算 机 内 的 表示 方式 。 
一 般 来 说 , 常见 的 大 数 存储 方式 有 字符 串 和 大 数 数 组 两 种 方式 。 字 符 串 存储 方式 采用 由 数字 组 成 
的 字符 串 存储 和 表示 大 数 ， 比 如 “1230948437372666438483287276”。 字 符 串 存储 方式 的 优点 是 
比较 直观 , 处 理 用 户 输入 和 输出 都 很 简单 ,不 需要 额外 的 转换 操作 。 但 是 字符 串 存储 方式 的 缺点 
也 很 明显 ,计算 时 需要 逐 位 将 数字 字符 转换 成 数字 进行 计算 , 然后 再 将 结果 转换 成 该 位 对 应 的 数 
字 字 符 , 这 使 得 计算 效率 很 低 。 采 用 大 数 数组 的 优点 就 是 计算 效率 高 ,而 且 可 以 采用 任意 进 制 的 
数字 存储 ， 比 如 2” 进 制 ，2* 进 制 等 。 此 外 ， 存 储 效率 也 比较 高 ， 占 用 空间 小 。 当 然 ， 采用 大 数 
数组 存储 方式 的 缺点 就 是 不 直观 ， 处 理 用 户 输入 和 输出 时 需要 进行 字符 串 转 换 操 作 。 


现在 比较 流行 的 几 个 大 数 运算 库 , 基本 都 是 使 用 大 数 数组 方式 存储 和 表示 大 数 , 本 章 介绍 的 
大 数 算法 也 采用 了 这 种 方式 。 采 用 数组 方式 存储 大 数 ,一般 采用 每 个 数组 元 素 表示 “一 位 ”的 方 
式 ， 数 组 元 素 从 低 到 高 分 别 表 示 大 数 每 “一 位 ”数字 。 每 个 数组 元 素 对 应 大 数 的 “一 位 ”数字 ， 
便于 进位 和 借 位 ， 计算 过 程 中 数字 按 位 对 齐 也 很 简单 。 现 在 来 介绍 一 下 大 数 的 “位 ”的 概念 ， 大 
数 的 每 一 位 数字 其 实 和 十 进 制 数字 的 每 一 位 数字 是 一 样 的 , 区 别 仅仅 是 这 一 位 数字 能 表示 的 计数 
单位 个 数 。 十 进 制 数字 每 个 数位 可 以 用 0 ~ 9 表示 10 个 计数 单位 ， 超 过 10 就 需要 进位 。 同 样 ， 
十 六 进 制 数字 每 个 数位 可 以 用 0~9，A ~F 表示 16 个 计数 单位 ， 超 过 16 同样 需要 进位 。 现 在 ， 
我 们 让 每 一 位 表示 更 多 的 计数 单位 ， 比 如 256(29 进 制 ， 为 了 能 表示 0 ~ 255 共 256 个 计数 ， 这 个 
数位 至 少 需要 8 个 比特 (刚好 可 以 用 unsigned char 类 型 的 数组 表示 )。256 进 制 的 数字 10 表示 
256 个 计数 单位 ， 相 当 于 十 进 制 数字 的 256。 

对 于 32 位 体系 的 计算 机 系统 来 说 ，CPU 处 理 32 位 数据 的 效率 比 处 理 8 位 (单字 节 ) 数据 高 ， 
因此 ， 如 果 进 一 步 扩展 , 采用 2?2 进 制 (0 x 100000000 进 制 ), 刚好 可 以 用 unsigned int 类 型 表示 大 
数 的 每 一 位 ， 使 得 计算 和 存储 都 很 高 效 。2” 进 制 原 理 也 很 简单 ， 就 是 用 每 一 个 32 位 整数 表示 大 数 
的 一 个 数位 ， 比 如 2” 进 制 的 数字 10 是 “两 位 数 "， 用 十 进 制 表 示 就 是 4294967296， 如 下 所 示 : 

23 进 制 的 数字 10 表示 为 : 00000001 00000000 = 4294967296 ( 十进制 ) 

高 位 低位 
前 面 举例 用 的 大 数字 1230948437372666438483287276， 用 2” 进 制 的 数字 表示 也 是 两 位 数 : 
8037F94B 71B59CEC = 1230948437372666438483287276 ( 十进制 ) 
高 位 低位 


本 章 介绍 的 大 数 算法 就 采用 了 2” 进 制 表示 大 数 ， 在 开始 介绍 算法 实现 之 前 ， 我 们 先 给 出 大 
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数 的 数据 定义 : 


class CBigInt 


// 符 号 位 ，0 表示 正 数 ，1 表示 负数 

unsigned int m Sign; 

// 大 数 在 X100000000 进 制 下 的 数字 位 数 

unsigned m nLength; 

// 用 数组 记录 大 数 在 xX100000000 进 制 下 每 一 位 的 值 
unsigned long m ulValue[MAX BI LEN]; 


}; 


CBigInt 类 没有 使 用 的 m_ulValue 数组 的 最 高 位 作为 符号 标志 ( 有 一 些 大 数 库 的 实现 确实 是 这 
么 做 的 )， 而 是 使 用 一 个 独立 的 属性 m_sign 作为 符号 标志 。 这 样 做 的 好 处 是 ， 在 不 考虑 符号 位 的 


情况 下 ,可 以 将 cBigInt 对 象 当 作 无 符号 数 计算 。 另 外 , 符号 位 单独 控 人 


前 ， 也 带 来 了 很 多 灵活 性 。 


比如 , 一 个 正 数 加 上 一 个 负数 的 情况 ,不 必 像 计算 机 那样 转换 成 补 码 进 行 计算 ,只 需要 将 其 转化 
成 无 符号 数 减 法 ， 然 后 再 设置 一 下 符号 标志 即 可 。CBigInt 类 的 内 部 结构 就 是 先 实现 无 符号 数 的 
加 减 乘除 算法 ， 然 后 再 加 上 符号 位 的 处 理 ， 支 持 带 符号 数 的 运算 。 


17.2.1 大 整数 加 法 


大 整数 运算 的 原理 , 就 是 用 基本 数据 类 型 模拟 大 整数 的 加 减 乘除 运算 ,包括 进位 和 借 位 。 在 


大 数 四 则 运算 中 , 加 法 是 最 基本 的 运算 ， 也 最 容易 实现 。 大 数 加 法 的 算法 就 是 按 位 相 加 ， 只 要 处 
理 好 进位 就 行 了 。 处 理 进位 的 关键 是 如 何 判断 “溢出 ”是 否 发 生 ， 两 个 正 数 相 加 ， 如 果 大 于 2 


所 能 表示 的 最 大 正 数 ， 就 发 生 溢出 ， 溢 出 意味 着 要 进位 。 如 果 没 有 64 位 整数 类 型 ， 


要 判断 两 个 


32 位 整数 相 加 是 否 发 生 溢出 还 真 不 容易 , 需要 判断 CPU 的 进位 标志 。 但 是 有 64 位 整数 类 型 就 简 
单 了 ， 直 接 将 两 数 之 和 赋值 给 一 个 64 位 整数 ， 然 后 判断 是 否 大 于 0 x FFFFFFFF， 如 果 大 于 0 x 


FFFFFFFF ， 就 说 明 需 要 进位 。 


下 面 就 以 竖 式 加 法 演示 一 下 大 数 加 法 的 过 程 , 如 图 17-1 所 示 , 这 个 过 程 和 十 进 制 竖 式 加 法 一 样 : 


FFFFFFFF| |FFFFFFFF 


十 二 1 1 


FFFFFFFF 


FFFFFFFF 


十 1 


1 


第 一 步 : 个 位 相 加 ,产生 进位 


十 +1 


1 


0 


0 


1 0 


0 


第 三 步 : 百 位 相 加 


图 17-1 大 数 加 法 计算 过 程 


第 二 步 : 十 位 相 加 ， 再 产生 进位 


0 ||FFFFFFFF||FFFFFFFF 
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和 十 进 制 的 99+1=100 一 样 ， 这 两 个 大 数 的 和 也 是 100， 不 过 是 2” 进 制 的 100， 相 当 于 十 进 
制 的 18446744073709551616。 在 不 考虑 符号 位 的 情况 下 ， 我 们 先 实现 无 符号 数 的 大 数 加 法 : 


void CBigInt::Add(const CBigInt& value1, const CBigInt& value2, CBigInt& result) 
{ 


result = value1; 


unsigned carry = 0; 
/* 先 调整 位 数 对 齐 */ 
if(result.m nLength < value2.m nLength) 
result.m nLength = value2.m nLength; 
for(unsigned int i = 0; i < result.m nLength; i++) 


unsigned _ int64 sum = value2.m ulValue[i]; 
sum = sum + result.m ulValue[i] + carry; 
result.m ulValue[i] = (unsigned long)sum; 
carry = (unsigned)(sum >> 32); 


} 

// 处 理 最 高 位 ， 如 果 当 前 最 高 位 进位 CarTy1=0， 则 需要 增加 大 数 的 位 数 

result.m ulValue[result.m nLength] = carry; 17 
result.m nLength += carry; 


} 

CBigInt::Add() 函 数 将 大 数 valuel 与 value2 的 和 存 人 result,CBigInt::Add() 函 数 不 改变 value1 
与 value2 的 值 ， 也 不 考虑 符号 位 。 要 支持 符号 位 其 实 很 简单 ， 如 果 参 与 计算 的 两 个 数 符号 相同 ， 
则 直接 调用 CBigInt::Add() 函 数 计 算 两 数 之 和 , 然后 将 符号 标志 设置 为 和 两 个 数 一 样 的 符号 即 可 。 
如 果 两 个 数 的 符号 位 不 相同 , 则 调用 下 一 节 将 介绍 的 无 符号 减法 函数 , 用 两 数 中 较 大 的 数 减 较 小 
的 数 ， 然 后 将 结果 的 符号 标志 设置 成 与 较 大 的 数 的 符号 标志 一 样 。CBigInt 类 重 载 了 + 运算 符 , 用 
于 支持 带 符 号 数 的 加 法 ， 根 据 上 述 描述 ， 算 法 实现 如 下 : 


CBigInt CBigInt::operator+(const CBigInt& value) const 


CBigInt r; 

if(m Sign == value.m Sign) 

{ 
CBigInt::Add(*this, value, r); 
r.m Sign = m Sign; 

} 

else 

{ 


if(CompareNoSign(value) >= 0) 


CBigInt::Sub(*this, value, 7); 
T.m Sign = m Sign; 
} 


else 


CBigInt::Sub(value, *this, r); 
r.m Sign = value.m Sign; 


] 
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return r; 


} 
17.2.2 ”大 整数 减法 


和 大 整数 加 法 一 样 , 大 整数 减法 的 设计 也 从 无 符号 数 的 减法 开始 。 大 数 的 减法 是 相对 比较 简 
单 的 算法 ， 和 加 法 一 样 , 也 是 按 位 相 减 ， 只 要 处 理 好 借 位 就 可 以 了 。 当 被 减 数 当前 位 比 减 数 小 的 
时 候 ， 就 要 向 前 一 位 〈 高 位 ) 借 位 。“ 借 ”， 十 进 制 数字 每 一 位 数字 有 10 个 计数 单位 ， 因 此 ， 向 
前 一 位 “ 借 1” 相 当 于 借 了 10 个 计数 单位 。2” 进 制 每 一 位 数字 则 有 0 x 100000000 ( 232 ) 个 计数 
单位 ， 因 此 ， 向 前 一 位 “ 借 1” 相 当 于 借 了 0 x 100000000 个 计数 单位 。 


大 数 减法 的 算法 流程 和 大 数 加 法 一 样 , 从 低 到 高 按 位 计算 。 如 果 被 减 数 的 对 应 位 上 的 数字 大 
于 或 等 于 减 数 ， 则 直接 对 这 一 位 做 减法 计算 ， 计 算得 到 的 值 就 是 最 终结 果 中 这 一 位 的 值 。 如 果 被 
减 数 对 应 位 上 的 数字 小 于 减 数 ， 则 设置 借 位 标志 ， 并 从 前 一 位 “ 借 1 ”。 当 前 一 位 的 数字 进行 计 
算 时 ， 被 减 数 除了 减 去 减 数 ， 还 要 根据 借 位 标志 判断 是 否 需要 再 减 1。 现 在 我 们 仍然 先 给 出 无 符 
号 数 减法 的 实现 代码 : 


void CBigInt::Sub(const CBigInt& value1, const CBigInt& value2, CBigInt& result) 


CBigInt r = valuel; 


unsigned int borrow = 0; 
for(unsigned int i = 0; i < r.m nLength; i++) 


{ 

if((r.m ulValue[i] > value2.m ulValue[i])||((r.m ulValue[i] == value2.m ulValue[i])&&(borrow 
== 0))) 

{ 
r.m ulValue[i] = r.m ulValue[i] - borrow - value2.m ulValue[i]; 
borrow = 0; 

} 

else 

{ 
unsigned _ int64 num = Ox100000000 + I.m ulValue[il]; 
r.m ulValue[i] = (unsigned long)(num - borrow - value2.m ulValue[i]); 
borrow = 1; 

} 


while((r.m ulValue[r.m nLength - 1] == 0) 8& (r.m nLength > 1)) 
r.m nLength--; 


result = 7; 
} 
CBigInt: :Sub() 函 数 的 计算 过 程 不 考虑 符号 位 ， 且 假设 被 减 数 ( valuel ) 总 是 大 于 或 等 于 减 数 
( value2 )。CBigInt::Sub() 函 数 的 实现 做 这 个 限制 是 有 目的 的 ， 首 先 就 是 这 样 做 简化 了 算法 实现 ， 
是 代码 专注 于 按 位 减 和 借 位 的 处 理 逻 辑 ， 避 免 一 些 不 必要 的 判断 和 处 理 逻 辑 。 其 次 ， 这 个 假设 使 
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得 大 数 的 符号 标识 独立 ,可 以 用 加 法 来 模拟 符号 相 异 ( 两 个 数 一 正 一 负 ) 的 两 个 数 的 减法 ,避免 
了 像 计算 机 那样 复杂 的 转 码 处 理 。 
带 符 号 的 大 数 减法 也 可 以 由 无 符号 大 数 的 加 法 和 减法 模拟 实现 。 其 原理 也 很 简单 ,如果 被 减 


数 和 减 数 符号 相 异 


， 则 调用 cBigInt: :Add() 函 数 在 忽略 符号 标识 的 情况 下 计算 二 者 之 和 ， 然 后 将 


符号 位 设置 成 和 被 减 数 符号 位 一 样 即 可 。 如 果 被 减 数 和 减 数 符号 相同 ,， 则 比较 二 者 的 绝对 值 , 用 
绝对 值 大 的 数 减 绝对 值 小 的 数 ， 并 将 减 过 的 符号 标识 设置 成 和 绝对 值 大 的 那个 数 一 致 。CBigInt 


类 重 载 了 “-” 运 算 符 ， 用 于 文 持 带 符号 数 的 减法 ， 根 据 上 述 描述 ， 算 法 实现 如 下 : 


CBigInt CBigInt::operator-(const CBigInt& value) const 


CBigInt IT; 


if(m Sign ! 
{ 


= value.m Sign) 


CBigInt::Add(*this, value, r); 
r.m Sign = m Sign; 


} 


else 


{ 


if(CompareNoSign(value) >= 0) 


CBigInt::Sub(*this, value, r); 
r.m Sign = m Sign; 


} 


else 


CBigInt::Sub(value, *this, 7); 
Ir.m Sign = (m Sign == 0) ? 1 : 0; // 需 要 变 号 


lL 
} 


CompareNoSign() 函 数 是 比较 两 个 大 数 的 大 小 ,并 忽略 符号 标识 ,相当 于 比较 两 个 大 数 的 绝对 值 。 
CompareNoSign() 函 数 的 实现 很 简单 ， 如 果 两 个 数 的 位 数 不 一 样 ， 则 位 数 多 的 数 比较 大 。 如 果 两 个 
数 的 位 数 相同 ， 则 从 高 位 开始 逐 位 比较 。CompareNosign() 函 数 实现 简单 ， 此 处 就 不 再 列 出 代码 。 


17.2.3 ”大 整数 乘 ; 

大 数 乘 法 比 大 数 加 法 和 大 数 减 法 复杂 一 点 ,但 是 计算 过 程 依然 是 按 位 相 乘 ， 并 处 理 进位 。 乘 
法 计算 的 进位 处 理 和 加 法 不 太一 样 ， 加 法 的 进位 一 般 是 “ 进 1”， 但 是 乘法 的 进位 可 不 一 定 是 1， 
但 是 也 不 会 超过 2”。 观 察 一 下 十 进 制 乘法 的 竖 式 计算 过 程 ， 可 以 发 现 其 主要 计算 过 程 就 是 乘 数 


与 被 乘 数 按 位 相 乘 


， 处 理 进 位 ， 然 后 乘 数 和 被 乘 数 移 位 ,重复 上 述 过 程 ， 直 到 结束 。 大 数 的 乘法 
计算 可 以 仿照 十 进 


捉 乘 法 的 计算 过 程 实现 ， 以 三 位 的 大 数 “1 5F 7FFFFFFF” 乘 以 “F” 为 例 , 其 


竖 式 乘法 计算 过 程 如 图 17-2 所 示 。 
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1 SF ||7FFFFFFF 1 SF ||7FFFFFFF 
x 7 F x F 
47 
7FFFFFF1 
598 |‖7FFFFFF1 


第 一 步 : 个 位 相 乘 ， 得 到 77FFFFFF1， 进 位 是 7 第 二 步 : 移 位 ， 再 相 乘 ， 得 到 591， 没 有 进位 ， 
与 个 位 进位 7 相 加 后 得 到 这 一 位 的 结果 


] SF || 7FFFFFFF 


F 598 ||7FFFFFFI1 
第 三 步 : 移 位 ， 相 乘 ， 得 到 大 数 百 位 的 结 生 


7 


17-2 ”大 数 乘法 计算 过 程 


CBigInt: :Mul() 函 数 计算 两 个 大 数 的 乘积 ,这 个 函数 不 考虑 符号 位 ,只 计算 无 符号 大 数 的 乘法 。 
如 果 考 虑 带 符 号 大 数 的 乘法 ,逻辑 上 比 带 符号 的 加 减法 还 简单 ， 因 为 符号 标识 的 确定 非常 简单 : 
如 果 乘 数 和 被 乘 数 同 号 则 结果 为 正 数 , 否则 结果 为 负数 。CBigInt 类 重 载 了 * 运 算 符 计算 带 符号 数 
的 乘法 ， 代 码 非 常 简单 ， 此 处 不 再 列 出 代码 。 


void CBigInt::Mul(const CBigInt& value1, const CBigInt& value2, CBigInt& result) 
{ 


unsigned _int64 carry = 0; 
result.m nLength = value1.m nLength + value2.m nLength - 1; // 初 步 估 算 结 果 的 位 数 
for(unsigned int i = 0; i < result.m nLength; i++) 


unsigned _int64 Sum = carry; 
carry = 0; 
for(unsigned int j = 0; j < value2.m nLength; j++) 


if(((i - j) >= 0)88( (i - j) < value1.m nLength)) 
{ 
unsigned _ int64 mul = valuei.m ulValuel[i - jl]; 
mul *= value2.m ulValue[j]; 
carry += mul >> 32; 
mul = mul & Oxffffffff; 
Sum += mul; 
} 
} 
carry += Sum >> 32; 
result.m ulValue[i] = (unsigned long)sum; 


} 
if(carry != 0) // 最 后 仍 有 进位 ， 则 大 数位 数 需要 扩大 


result.m nLength++; 
result.m ulValue[result.m nLength - 1] = (unsigned long)carry; 
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17.2.4 ”大 整数 除法 与 模 


除法 表达 的 是 两 个 数 之 间 的 倍数 关系 , 这 种 倍数 关系 可 以 用 连续 的 减法 进行 测试 。 大 整数 除 
法 最 简单 的 实现 方法 就 是 用 被 除数 去 减 除数 ,重复 这 个 减法 过 程 ， 直 到 被 除数 小 于 除数 为 止 , 这 
个 过 程 中 进行 减法 的 次 数 就 是 最 终 的 结果 。 但 是 , 这 种 方法 也 是 效率 最 低 的 方法 ,如 果 除 数 非常 
小 ， 而 被 除数 又 非常 大 ， 那 么 这 个 减 的 过 程 将 非常 耗 时 。 必 须 对 其 进行 优化 ,否则 ,任何 有 进取 
心 的 大 整数 计算 都 不 会 采用 这 种 方法 实现 除法 运算 。 

优化 的 方向 就 是 “ 试 商 ”。 这 和 我 们 做 竖 式 除法 的 原理 一 样 , 我们 先 用 135 : 6 演示 一 下 十 进 
制 竖 式 除法 的 过 程 ， 如 图 17-3 所 示 。 


| pa 2 
61113 5 6[1 315 Ooh) 
: 1 2 1 2 
5 1 5 
1 2 
第 一 步 : 从 高 位 对 第 二 步 : 用 2 试 商 ， 第 三 步 ， 再 用 2 试 商 ， 此 
齐 因为 1<6， 被 除 结果 是 12， 此 时 的 时 的 结果 是 20+2， 被 除 
数 高 位 后 移 1 位 初步 结果 是 20 数 剩 3， 除 法 结束 


图 17-3 ”十进制 除法 计算 过 程 


除法 的 整个 过 程 仍 然 是 多 次 减法 重复 的 过 程 ， 但 是 试 商 的 结果 是 每 次 可 以 减 去 除数 的 若干 
倍 ， 能 极 大 地 加 快 这 个 减 的 过 程 ， 提 高 计算 效率 。 

大 整数 的 除法 ,依然 采用 这 个 原理 ， 从 被 除数 和 除数 的 高 位 开始 ， 如 果 被 除数 的 高 位 小 于 除 
数 ， 则 用 被 除数 的 高 位 和 次 高 位 组 成 两 位 大 数 与 除数 的 高 位 做 除法 这 要 得 益 于 系统 提供 的 64 
位 整数 原生 运算 支持 ， 大 大 简化 了 算法 的 复杂 度 )。 这 个 除法 的 结果 就 是 试 商 的 依据 ， 同 时 也 是 
结果 的 一 部 分 ， 要 累加 到 最 终 的 结果 中 。 但 是 ， 到 底 累 加 多 少 呢 ? 假 如 这 个 除法 的 结果 是 5， 那 
么 , 结果 是 加 5 还 是 加 50, 或 者 是 500、5000 呢 ? 那 就 要 看 被 除数 拿 掉 最 高 位 和 次 高 位 后 还 剩 多 
少 位 ， 对 于 大 整数 来 说 ， 如 果 是 剩 0 位 ， 则 结果 就 累加 5， 如 果 剩 1 位 ， 则 结果 就 累加 5 x 2”， 
如 果 剩 2 位 ， 则 结果 就 累加 5 x 2“， 以 此 类 推 。 

整数 的 除法 运算 通常 都 不 会 刚好 除 尽 , 其 结果 总 是 分 成 两 部 分 : 商 和 余数 , 大 整数 也 不 例外 。 
被 除数 在 整个 除法 过 程 中 逐步 减少 , 最终 当 被 除数 小 于 除数 的 时 候 , 此 时 的 被 除数 的 值 就 是 余数 ， 
因此 ， 除 法 和 取 模 是 同一 个 过 程 。 

CBigInt: :Div() 函 数 计算 两 个 大 数 的 除法 ,得 到 商 和 余数 ,这 个 函数 同样 不 考虑 大 整数 的 符号 ， 
CBigInt 类 重 载 了 /和 % 运 算 符 ， 用 于 提供 带 符 号 大 整数 的 除法 和 取 模 。 两 个 带 符 号 位 的 大 整数 相 
除 ， 其 结果 的 符号 位 判别 方法 和 乘法 一 样 ， 如 果 两 数 同 号 ， 则 商 结果 是 正 数 ， 如 果 两 数 异 号 ， 则 
商 结果 是 负数 。 对 于 取 模 运算 ,也 就 是 余数 的 符号 则 更 简单 ， 它 总 是 和 被 除数 的 符号 一 致 。 

void CBigInt::Div(const CBigInt& value1, const CBigInt& value2, CBigInt& quotient, CBigInt& remainder) 

{ 


村 
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CBigInt r 
CBigInt a = valuel; 
while(a.CompareNoSign(value2) >= 0) 


{ 


1 ll 
Oo 


unsigned _ int64 div = a.m ulValue[a.m nLength - 1]; 

unsigned _ int64 num = value2.m ulValue[value2.m nLength - 1]; 
unsigned int len = a.m nLength - value2.m nLength; 

if((div == num) 8& (len == 0)) 


CBigInt::Add(r, CBigInt(1), r); 
CBigInt::Sub(a, value2, a); 
break; 


} 
if((div <= num) 8& (len > 0)) 
{ 
len--; 
div = (div << 32) + a.m ulValuel[la.m nLength - 2]; 
} 
div = div / (num + 1); 
CBigInt multi = div; // 试 商 的 结果 
if(len > 0) 
{ 
multi.m nLength += len; 
unsigned int i; 
for(i = multi.m nLength - 1; i >= len; i--) 
multi.m ulValue[i] = multi.m ulValue[i - len]; 
for(i = 0; i < len; i++) 
multi.m ulValue[i] = 0; 


} 
CBigInt tmp; 
CBigInt::Add(r, multi, r); 
CBigInt::Mul(value2, multi, tmp); 
CBigInt::Sub(a, tmp, a); 

} 

quotient = 7; 

remainder = ai 


} 
17.2.5 “大 整数 乘 方 运算 


整数 的 乘 方 运算 可 以 分 解 为 整数 的 连 乘 , 因此 乘 方 的 最 简单 实现 方法 就 是 用 连续 乘法 计算 代 
葡 。 采用 这 种 实现 方案 , 计算 一 个 数 的 nn 次 方 需要 做 次 乘法 计算 。 人 A 有 没有 方法 可 以 
减少 一 些 乘法 计算 次 数 ? 来 看 一 个 例子 ， 计 算 oo， 根 据 乘 方 的 意义 : a? = as xa， 只 要 能 计算 出 
则 计算 只 需要 做 一 次 乘法 。as 又 可 以 分 解 为 at xa*， 因 此， 只 需要 计算 出 a, 必 也 只 需要 
一 次 乘法 就 可 以 得 到 。 继 续 这 个 过 程 ，a! 又 可 以 分 解 为 a xa*， 只 要 计算 出 a2， 则 只 需要 一 次 乘 
法 计算 就 可 以 得 到 性 。 最 后 计算 也 只 需要 一 次 乘法 ， 看 到 了 吧 ， 整 个 过 程 变 成 了 4 次 乘法 计 
算 ， 这 就 是 神奇 的 平方 - 乘 降 因 法 ， 也 称 为 二 进 制 平方 和 乘法 。 利 用 乘 方 计算 的 数学 性 质 将 其 逐 
步 分 解 ， 可 以 有 效 地 减少 乘法 计算 量 ， 提 高 计算 效率 。 
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计算 乘 方 的 算法 实现 刚好 是 上 述 分 析 过 程 的 逆 过 程 , 仍 以 计算 a 为 例 , 设 临时 变量 t 初始 化 
为 a， 结 果 初始 化 为 1。 乘 方 9 的 二 进 制 表示 是 1001 ， 从 最 低位 开始 处 理 。 最 低位 是 1， 计算 
r=r*t， 同 时 计算 t=t ， 此 时 r=a，t=a*。 倒数 第 二 位 是 0， 计算 t=-t*， 此 时 t=a 。 倒 数 第 三 位 仍然 
是 0, 继 续 计 算 t=t”, 此 时 t=a”。 最 高 位 是 1 ,计算 r=r*t, 此 时 r=a*as=a’, 完 成 计算 ,cBigInt: :Power() 
函数 计算 value 的 nn 次 方 ,结果 存放 在 result 中 ， 这 个 函数 也 不 考虑 符号 位 。CBigInt 类 重 载 了 ^ 
运算 符 ， 这 个 重 载 ^ 运 算 符 的 版 本 支持 带 符号 数 的 乘 方 计 算 ， 处 理 符号 标识 的 方法 也 很 简单 ， 如 
果 n 是 奇数 ,结果 的 符号 标识 与 value 一 样 ， 如 果 n 是 偶数 ， 结 果 的 符号 标识 总 是 + 号 。 

void CBigInt::Power(const CBigInt& value, const CBigInt& n, CBigInt& result) 


result = 1; 
CBigInt t = value; 


for( int64 i = 0; i < n.GetTotalBits(); i++) 
if(n.TestBit(i)) 
. CBigInt::Mul(result, t, result); 
CBigInt::Mul(t, t, t); 


} 


17.3 ”大 整数 类 的 使 用 


至 此 ， 我 们 已 经 实现 了 大 整数 的 四 则 运算 和 乘 方 计算 ( 包括 取 模 计算 )， 这 也 是 整数 计算 中 
常用 的 几 种 方法 。 用 这 些 方法 已 经 可 以 支撑 我 们 完成 比较 复杂 的 大 数 计算 ,包括 RSA 加 密 算法 
需要 的 模 窒 和 模 乘 运算 。 除 此 之 外 ， 为 了 实现 类 似 计算 器 的 功能 ， 还 必须 有 和 用 户 交 互 的 接口 。 
大 整数 在 计算 机 内 部 是 以 数组 的 形式 存在 , 占用 空间 小 , 并 且 高 效 , 但 是 如 果 反 映 在 用 户 界面 上 ， 
却 不 符合 人 类 的 使 用 习惯 。 通 常人 们 还 是 习惯 使 用 数字 组 成 的 字符 串 输 入 数字 , 也 只 看 得 懂 字 符 
串 形式 的 数字 ( 尽管 当 数 字 位 数 非常 多 的 时 候 ， 人 们 已 经 不 知道 其 实际 意义 了 )。 

大 整数 的 输入 , 是 将 数字 组 成 的 字符 串 转 换 成 内 部 的 数组 形式 的 大 数 , 通常 这 些 字符 串 都 是 
十 进 制 的 数字 , 但 是 也 可 以 是 十 六 进 制 的 数字 。 把 一 个 数字 字符 串 转 换 成 一 个 大 数 与 转换 成 普通 
的 整数 本 质 上 是 一 样 的 , 都 可 以 参照 C 语 言 的 库 函 数 atoi() 来 实现 。 同样 , 大 整数 的 输出 也 可 以 
参照 itoa() 函 数 实现 。 


17.3.1 与 Windows 的 计算 器 程序 一 决 高 下 


如 果 早 点 有 了 cBigInt 类 ， 就 不 会 在 同学 面前 出 丑 了 ,现在 回 过 头 再 看 看 Windows 自 带 的 计 
算 器 程序 ， 发 现 其 整数 计算 最 大 也 只 能 支持 到 18446744073709551615， 真 是 太 弱 了 。 现 在 向 小 
伙伴 们 炫 光一 下 吧 ， 谁 能 计算 出 : 
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1445628445840946744607609235783709524795667819061352 
乘 以 

18446445674407667997096551006152135 
的 结果 是 多 少 ? 当然 是 : 


2666670659158341182219319483583079977924259014202925005918210611087893243497301 
0786520 


是 否 正确 ?现在 只 有 你 知道 。 


17.3.2 最 大 公约 数 和 最 小 公 倍数 


求 两 个 数 或 多 个 数 的 最 大 公约 数 ( greatest common divisor ) 和 最 小 公 倍 数 ( least common 
multiple ) 是 整数 计算 中 最 常见 的 算法 问题 ， 这 里 我 们 来 讨论 几 种 计算 最 大 公约 数 和 最 小 公 倍数 
的 方法 。 首 先 看 看 最 大 公约 数 ,求解 最 大 公约 数 有 很 多 算法 ， 比 如 轧 转 相 除 法 、 轧 转 相 减法 以 及 
小 学 生 都 会 的 短 除法 等 。 轰 转 相 除法 在 汉代 的 《 九 章 算 术 》 一 书 中 就 有 记载 ,在 西方 义 被 称 为 欧 
几 里 得 算法 ， 是 求 最 大 公约 数 的 传统 算法 ， 这 种 方法 进行 回转 相 除 的 理论 依据 是 下 面 的 定理 : 

GCD(a, 5)=GCD(b,a mod5) (a modb 表 示 a 除 以 5 的 余数 ) 

这 就 是 朴素 欧 几 里 得 定理 , 利用 这 个 定理 实现 最 大 公约 数 的 递归 算法 非常 简单 。 在 一 些 不 适 
合 使 用 递归 算法 的 场合 ( 比如 某 些 单 片 系统 )， 也 可 以 使 用 非 递 归 的 算法 ， 求 最 大 公约 数 算法 的 
大 数 计算 版 本 一 般 采 用 非 递归 的 算法 实现 : 


CBigInt EuclidGcd(const CBigInt& a, const CBigInt& b) 


{ 
CBigInt c = (a 
CBigInt result 


C= Cc% result; 
while(c != 0 
{ 
CBigInt tmp = ¢; 
C = result; 
result = tmp; 
c= Cc% result; 


} 
return result; 
} 
辑 转 相 除 法 实现 简单 ,效率 还 可 以 , 但 是 大 数 求 余 需要 大 数 除 法 的 支持 ， 而 大 数 除法 一 般 效 
率 不 高 ， 如 果 能 够 避免 除法 和 取 模 ，, 则 可 以 极 大 地 提高 求 最 大 公约 数 算法 的 效率 。J.Stein 在 1961 
年 提出 了 一 种 改进 的 算法 , 只 使 用 大 数 的 加 减法 和 移 位 ( 除 2 可 用 移 位 代替 ), 这 称 为 Stein 工法 。 
Stein 算法 的 理论 依据 是 : 
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GCD(ka, kb) = k * GCD(a, b) 
当 取 特别 的 值 2 时 ， 可 以 利用 整数 的 移 位 操作 递归 地 对 原 数 据 a 和 4 进行 规约 。 下 面 来 看 
看 Stein 算法 的 概念 实现 : 


CBigInt SteinGcd(const CBigInt& a, const CBigInt& b) 

{ 
CBigInt biger = (a > b)? 
CBigInt smaller = (a > b)? 


if(smaller == 0) 
return biger; 
if((biger % 2 == 0) && (smaller % 2 == 0)) 
return SteinGcd(biger / 2, smaller / 2) * 2; 
if(biger % 2 == 0) 
return SteinGcd(biger / 2, smaller); 
if(smaller % 2 == 0) 
return SteinGcd(biger, smaller / 2); 


return SteinGcd((biger + smaller) / 2, (biger - smaller) / 2); 


} 

看 起 来 好 像 比 传统 算法 有 更 多 的 除法 和 乘法 , 但 是 取 模 可 以 用 位 测试 代替 , 乘 2 和 除 2 都 可 
以 用 整数 移 位 来 代替 ， 实 际 上 是 规避 了 效率 比较 低 的 大 数 除 法 ， 这 个 给 出 的 steinGcd() 函 数 只 是 
一 个 概念 实现 ， 有 兴趣 的 读者 可 以 用 移 位 对 其 进行 优化 。 

除了 轧 转 相 除 法 和 Stein 算法 ， 轰 转 相 减法 也 是 一 种 比较 容易 编程 实现 的 算法 。 轧 转 相 减法 
看 起 来 只 用 了 减法 ,避免 了 乘法 和 除法 , 但 是 实际 效果 并 不 理想 , 特别 是 在 两 个 数 相差 很 大 的 情 
况 下 ,会 导致 循环 很 多 次 也 无 法 收敛 。 这 里 只 给 出 算法 ,读者 可 自行 研究 。 


CBigInt SubstractGcd(const CBigInt& a, const CBigInt& b) 


L CBigInt aa = a; 
CBigInt bb = b; 
while(aa != bb) 

{ 
if(aa > bb) 
aa = aa - bb; 
} 
else 
{ 
bb = bb - aa; 
} 
} 
return aa; 
} 


几 个 数 公 有 的 倍数 就 是 公 倍 数 , 其 中 最 小 的 一 个 就 是 最 小 公 倍数 。 求 最 小 公 倍数 的 方法 也 有 
很 多 ， 比 如 短 除法 、 分 解 质 因 数 法 等 ,最 简单 的 方法 是 利用 最 大 公约 数 和 最 小 公 售 数 的 关系 间接 
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地 获得 最 小 公 倍 数 。 以 两 个 数 为 例 ， 最 小 公 倍 数 和 最 大 公约 数 存在 以 下 关系 : 
最 大 公 因 数 x 最 小 公 倍 数 = 两 数 的 乘积 
根据 这 个 关系 得 到 简单 的 求 最 小 公 倍 数 的 算法 实现 如 下 : 


CBigInt GcdLcm(const CBigInt& a, const CBigInt& b) 


CBigInt r = (a * b) / EuclidGcd(a, b); 
return r; 

} 

这 个 算法 存在 的 主要 问题 是 大 数 的 乘法 ， 会 导致 需要 超过 一 倍 的 存储 空间 存储 大 数 的 乘积 ， 
如 果 cBigInt 类 只 能 支持 2048 比特 的 大 整数 ， 则 GcdLcm() 函 数 只 能 计算 两 个 小 于 1024 比特 的 大 
整数 的 最 小 公 倍数 。 如 果 不 使 用 最 大 公约 数 帮 忙 , 还 可 以 考虑 用 自 加 加 整除 测试 的 方法 计算 最 小 
公 倍数 。 假设 要 求 整 数 a 和 b 的 最 小 公 倍数 ,首先 看 a 是 否 能 被 b 整除 ,如 果 不 能 就 继续 测试 24 
能 否 被 5b 整除 ， 继 续 这 个 过 程 ， 直 到 na 的 时 候 能 被 5 整除 ， 则 na 就 是 a 和 5 的 最 小 公 倍数。 用 
这 种 方法 实现 的 算法 如 下 : 

CBigInt NormalLcm(const CBigInt& a, const CBigInt& b) 

{ 


CBigInt r = a; 


while(r % b != 0) 
{ 


} 


r += a; 


return IT; 


} 
很 显然 , 这 种 方法 也 存在 问题 , 比如 a 非常 小 而 5 非常 大 的 时 候 , 会 导致 while 循环 相当 漫长 。 


17.3.3 ”用 扩展 欧 几 里 得 算法 求 模 的 逆 元 


对 于 任意 整数 we、 和 c， 形 如 ax + by=c 的 方程 就 被 称 为 线性 不 定 方 程 。 根 据 贝 祖 定理 ”， 
如 果 c 是 a 和 4 的 最 大 公约 数 ， 则 该 不 定 方 程 存在 整数 解 。 当 cc 是 a 和 45 的 最 大 公约 数 的 整数 倍 
时 ， 不定 方程 有 多 组 解 ， 每 一 组 解 之 间 存 在 c/gcd(a,b) 的 倍数 关系 。 求 解 ax+by= gcd(a,b) 通 常 可 
使 用 扩展 欧 几 里 得 算法 ， 其 基本 原理 仍然 是 朴素 欧 几 里 得 定理 。 

扩展 欧 几 里 得 算法 其 实 并 不 复杂 , 其 推导 过 程 和 很 简单 。 首 先 利 用 朴素 欧 几 里 得 定理 给 出 的 
最 大 公约 数 辑 转 关系 : gcd(a,b) = gcd(b,a%b)， 将 不 定 方 程 ax + by = gcd(a,b) 转 换 成 男 一 种 形式 : 


ax+by= gcd(a,b)= gcd(b,a%b) = bx't+ (a%b)y’ 
重复 ( 递归 痢 用 以 上 轧 转 关系 ,最 终 会 有 a%b=0, 原 方程 最 终 可 以 转换 成 :ax+0*y 皇 gcd(a,0)， 


@ 贝 祖 定理 : 给 两 个 整数 a 和 5b， 必然 存在 一 对 整数 x 和 y， 使 得 ax+by=gcd(a,b)。 
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解 这 个 方程 很 容易 ， 只 要 令 x'= 1，y 牛 0 即 可 。 很 显然 ,经 过 这 样 的 转换 后 得 到 的 解 ， 已 经 不 是 
原 方程 的 解 ， 但 是 ， 根据 上 述 转换 的 递 失 关系 ， 可 以 反 向 递 推出 原 方程 的 解 。 
a%b 可 以 理解 为 a-(a/b)*b， 将 其 代入 到 上 述 递 推 关系 中 ， 可 以 得 到 每 一 次 轧 转 变换 后 (x,y) 
与 (x”y) 的 递 推 关 系 : 
ax+by= bx'’+(a%b)y'= bx+ (a— (a/b)*b)y'= ay’+b(x(a/b)y") 
利用 恒 等 关 系 ， 可 以 得 到 以 下 递 推 关系 : 


X=y" 
y=Xx~(a/b)*y" 
利用 这 个 关系 逐 级 反 推 即 可 得 到 原 方程 的 解 。ExtEuclid() 函 数 给 出 了 求解 形 如 ax+by=1 的 
不 定 方程 的 算法 实现 ( 暗含 gcd(a,b)=1 的 条 件 ): 


CBigInt ExtEuclid(const CBigInt& a,const CBigInt& b,CBigInt& x,CBigInt& y) 
' 


return a; 
} 
CBigInt xp,yp; 
CBigInt c = ExtEuclid(b, a%b, xp, yp); 
XS: YP 
y= xp- (a/b)* yp; 


return c; 

} 

除了 求解 线性 不 定 方程 , 扩展 欧 几 里 得 算法 还 被 用 来 求解 线性 同 余 方程 和 模 的 逆 元 。 我 们 定 
义 以 下 形式 的 方程 为 同 余 方程 : ax=4b (modn)， 当 且 仪 当 满 足 gcd(a,n)15 条 件 时 ， 此 方程 有 整数 
解 ， 且 有 gcd(a,n) 个 整数 解 。 如 果 引 入 一 个 整数 y (y 可 为 任意 整数 值 )， 将 同 余 方 程 的 右边 转换 
成 ny + b5， 则 线性 同 余 方程 可 以 转换 为 线性 不 定 方程 ax -ny = bp， 如 此 一 来 就 可 以 利用 扩展 欧 几 . 
全 x (yy 为 指定 整数 , 注意 符号 可 能 是 反 的 )。 对 于 同 余 方 程 ax=b (modn), 若 gcd(a,n) 

， 则 方程 有 唯一 的 整数 解 ， 在 这 种 情况 下 ， 如 果 5b 也 等 于 1， 则 这 个 唯一 的 整数 解 就 被 称 为 a 
n 的 乘法 逆 元 ， 记 为 x = an”。 和 求 最 大 公约 数 一 样 ， 求 大 整数 模 的 乘法 逆 元 也 是 RSA 非 对 
称 密 钥 加 密 体 系 中 的 一 个 基本 操作 ， 具 有 非常 重要 的 意义 。 

当 b= 1 的 时 候 ， 同 余 方 程 ax= 1 (mod n) 可 以 转化 为 线性 不 定 方程 ax - ny= 1， 这 样 就 可 
以 利用 前 面 讨论 的 扩展 欧 几 里 得 算法 求解 x 和 yy。 需要 注意 的 是 ， 此 时 得 到 的 y 的 符号 是 反 的 ， 
但 是 同 余 方程 的 转换 只 是 将 y 作 为 一 个 辅助 整数 引入 ,并 不 关心 其 值 。 前 面 已 经 分 析 过 扩展 欧 几 
里 得 算法 的 求解 步 台 和 解 的 递 推 计算 方法 ， 只 需要 用 nn 代替 bp， 并 忽略 y 的 值 ， 就 可 以 得 到 同 余 
方程 的 求解 算法 。 


酝 
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CBigInt CongruenceEquation(const CBigInt& a, const CBigInt& n) 
{ 
CBigInt x,y; 


CBigInt r = ExtEuclid(a, n, x, y); 
if(r > 0) 
{ 


return x; 


. 


return 0; 


} 
17.4 总 结 


有 人 认为 大 数 计算 是 科学 家 才 会 用 到 的 东西 ,生活 中 不 会 用 到 这 么 大 的 数字 ,其 实 不 然 。 大 
数 计算 可 不 仅仅 是 用 来 做 计算 器 用 的 , 在 天 文 、 物 理 等 各 个 领域 都 离 不 开 大 数 运 算 。 著 名 的 RSA 
算法 的 本 质 也 是 大 整数 的 指数 计算 。 在 生物 学 领域 , DNA 的 分 解 和 重组 研究 也 离 不 开 大 数 运算 。 

Miracl 和 Freelip 都 是 比较 著名 的 大 数 计算 库 ， 本 童 的 算法 有 些 就 是 参考 了 这 些 库 的 设计 思 
想 。 除 此 之 外 , 很 多 专业 的 加 密 软 件 包 都 会 包含 大 数 计算 的 库 , 读者 可 自行 研究 。 完整 的 cBigInt 
类 的 实现 代码 包含 在 本 章 附带 的 示例 代码 中 ， 包 括 简 单 的 测试 用 例 。 第 18 章 介绍 RSA 算法 时 ， 
还 会 用 到 这 个 类 的 实现 。 
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第 7 df 章 
RSA 算法 一 一 加 密 与 签名 


RSA 算法 (Rivest-Shamir-Adleman ) 是非 对 称 公 钥 加 密 体系 的 开山 鼻祖 , 经 过 几 十 年 的 发 展 ， 
RSA 算法 在 银行 、 军 事 、 通 信 等 领域 得 到 了 广泛 的 应 用 。RSA 算法 不 仅 用 于 数据 加 密 ， 还 可 用 
于 数字 签名 和 身份 验证 。 虽 然 现 在 顶 圆 加 密 算法 (Elliptic Curves Cryptography，ECC ) 的 应 用 也 
是 如 日 中 天 , 但 是 RSA 算法 仍然 在 非 对 称 公 钥 加 密 体 系 中 占有 一 席 之 地 。 

RSA 算法 是 一 种 非常 简洁 的 加 密 算法 ， 远 没有 人 们 想象 的 那么 复杂 和 神秘 。RSA 算法 背后 
的 数学 理论 就 是 大 素数 分 解难 题 ， 其 算法 实现 的 核心 是 大 整数 的 模 寡 运算 。 有 了 第 17 章 介绍 的 
大 整数 运算 基础 ， 实 现 RSA 算法 就 易如反掌 


18.1 RSA 算 法 的 开 骨 菜 


RSA 算法 的 核心 是 大 整数 的 模 圭 运算 (Modular Power )， 模 寡 运 算 又 称 为 模 乘 方 运 算 。 用 数 
学 表达 式 表示 模 寡 运算 就 是 : 


oO 


C=A^B (modn) 

我 们 已 经 实现 了 大 数 的 乘 方 运算 和 取 模 运算 , 只 需要 先 计算 A 的 B 次 方 , 然后 再 对 这 个 中 
间 结 果 用 除法 求 余数 就 可 以 得 到 结果 。 但 是 这 个 方案 存在 一 个 很 大 的 问题 ,就 是 乘 方 和 除法 取 
余数 的 计算 量 都 非常 大 ， 效率 不 高 。 除 此 之 外 ， 乘 方 计算 的 中 间 结 果 将 是 一 个 非常 大 的 数 ， 
为 操作 数 不 确 定 ， 所 以 也 无 法 估计 这 个 结果 会 多 大 ， 大 数 必 须 支 持 非常 多 的 位 才能 保存 这 个 中 
间 结 果 。 

根据 RSA 算法 的 性 质 可 以 看 出 ， 模 宕 运算 的 性 能 决定 了 RSA 算法 的 性 能 。 为 了 解决 模 寡 
运算 效率 的 问题 ， 现 代数 学 界 提出 了 很 多 解决 方案 。 这 些 解 决 方案 的 基本 思想 都 是 先 将 模 寡 运 
算 转 换 成 模 乘 运算 ( Modular Multiplication )， 然 后 再 用 高 效 的 算法 处 理 模 乘 运算 。 本 节 要 介绍 
的 快速 模 需 和 模 乘 算法 都 是 实现 高 效 RSA 算法 必 不 可 少 的 组 件 , 可 以 称 为 RSA 算法 的 开胃 菜 。 
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18.1.1 将 模 窜 运 算 转 化 为 模 乘 运算 

前 面 介绍 过 ， 对 于 模 宕 运算 ， 如 果 用 先 求 寡 再 取 模 的 方式 直接 计算 结果 , 在 很 多 情况 下 是 不 
能 接受 的 。 即 便 不 考虑 乘 方 计算 的 低 效率 ， 中 间 结 果 的 存储 也 是 个 棘手 的 问题 。 以 1024 比特 的 
大 整数 的 乘 方 计算 为 例 , 其 二 次 方 的 结果 最 大 可 能 需要 2048 比特 的 存储 空间 ,其 1024 次 方 的 结 
果 最 大 可 能 需要 1 兆 比特 ( 约 128 千 字 节 ) 的 存储 空间 。 对 于 大 数 计算 来 说 ，1024 作为 指数 简直 
是 个 微不足道 的 值 ， 考 虑 到 指数 也 可 能 是 1024 比特 的 大 整数 ， 存 储 中 间 结 果 最 终 需 要 的 内 存 
将 超出 计算 机 的 能 力 。 

模 宕 计算 的 解决 思路 是 将 其 转化 为 模 乘 计算 ,避免 直接 求 宕 带 来 的 存储 和 效率 问题 。 模 乘 的 


数学 表达 式 是 : 


Ny 


C=AxB (modn) 
那么 ， 如 何 将 模 寡 计算 转化 成 模 乘 计算 呢 ? 在 第 17 章 介 绍 大 整数 计算 时 ， 提 到 过 一 种 优化 
乘 方 运算 的 “平方 - 乘 降 需 法 ”, 在 计算 大 数 乘 方 时 可 以 有 效 地 减少 乘法 计算 的 次 数 。 在 处 理 模 圭 
运算 时 , 同样 可 以 利用 这 种 思想 将 模 寡 运算 转化 成 一 些 列 模 乘 运算 。 将 模 寡 运算 转化 成 模 乘 运算 ， 
需要 利用 模 运 算 的 两 个 特性 ， 即 : 
(a x b)%n = (a%on x bYon)Yon 
(a+b)%n= (a%n + bY%n)Yon 
以 计算 29%n 为 例 ， 可 以 分 解 为 (a %n xa%n)%n， qs%n 又 可 以 分 解 为 (qt%n x a %n)%n， 
at%n 又 可 以 继续 分 解 为 (q*% nx a % n)%n， a *%n 最 终 分 解 为 (a %n xa%n)%n。 利 用 这 种 思 
想 ，a? % n 的 模 窜 运 算 就 转换 成 5 次 模 乘 运算 。 这 种 转换 的 算法 实现 类 似 于 cBigInt: :Power() 函 
数 的 实现 ， 非 常 简单 : 


CBigInt ModularPower(const CBigInt& M, const CBigInt& E, const CBigInt& N) 


{ 
CBigInt k = 1; 
CBigInt n = M % N; 


for( int64 i = 0; i < E.GetTotalBits(); i++) 


if(E.TestBit(i)) 
{ 


k= (k* n)%N; 


= (Nn*n)%N; 
: 


return k; 
} 
CBigInt Modularpower() 函 数 可 以 将 M5% NN 的 计算 转化 成 平均 3log(E)/2 次 模 乘 运算 。 这 只 是 
对 模 短 运算 优化 的 第 一 步 , 接 下 来 还 要 利用 蒙哥马利 模 乘 再 对 模 乘 运算 进行 优化 , 化 解 不 必要 的 
除法 计算 ， 进一步 提高 模 究 计算 的 速度 。 
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18.1.2，” 模 乘 运算 与 蒙哥马利 算法 

影响 模 乘 运算 速度 的 关键 在 于 费时 的 取 模 运 算 〈 除法 计算 )， 如 果 在 模 乘 运算 中 不 用 除法 或 
尽量 少 用 除法 , 将 大 大 提高 模 寡 运算 的 速度 。 数 学 家 们 研究 了 很 多 快速 计算 模 乘 的 算法 ， 蒙 哥 马 
利 算法 (Montgomery Reduction ) 就 是 其 中 的 一 种 。 大 家 可 能 对 二 战 时 期 著名 的 英国 陆军 元 帅 蒙 
哥 马 利 比 较 熟悉 ， 但 是 此 蒙哥马利 非 彼 蒙哥马利 。 蒙 哥 马 利 算法 是 由 彼得 蒙哥马利 ( Peter 工 . 
Montgomery ) 在 1985 年 提出 的 一 种 大 数 模 乘 快速 计算 方法 ， 又 称 为 蒙哥马利 约 分 算法 。 

蒙哥马利 约 分 的 基本 思想 就 是 选择 一 个 适当 的 R= 2“, 大 满足 条 件 : n < 2:， 将 对 的 取 模 运 
算 转 化 为 对 R 的 完全 剩余 系 计算 ,对 R 的 除法 计算 可 以 转换 为 移 位 操作 ， 从 而 避免 了 除法 计算 。 
因为 R>n, 且 R 是 2 的 整数 师 , n 是 素数 ,因此 RR 和 nn 互 素 , 根据 欧 拉 方程 有 解 的 条 件 可 知 ， 一 
定 存 在 整数 0< R11<n 和 0<n'’<R, 满足 RR -nn'=1。 此 时 可 以 将 4xB (mod n) 的 计算 转化 为 
计算 4xBxR” (mod n)， 其 中 4' 和 B 分 别 是 4 和 B 对 RR 的 剩余 系 表达 ， 即 : 

A'=A x R (modn) 
B'=B x R(modn) 

AXB'xR”" (mod 7 丰 称 为 蒙哥马利 模 乘 ， 它 可 以 利用 蒙哥马利 约 分 算法 高 效 地 计算 出 来 ， 蒙 哥 
马 利 约 分 算法 的 计算 方法 如 下 : 

function REDC(A', B', n', R, N) 

S A" WB 

= (S mod R) x n' mod R 
= (S+m)/R 
f(t >= N) 


then return 七 - N 
else return t 


根据 以 上 描述 的 方法 可 以 很 容易 写 出 蒙哥马利 约 分 算法 的 实现 代码 : 


CBigInt MontgomeryReduction(const CBigInt& X, const CBigInt& Y, const CBigInt& Np, const CBigInt& N， 
const CBigInt& R) 


{ 
CBigInt S =X * Y; 
CBigInt m = (S * Np) % R; 
= (S+mM*N)/R; 
if(S >= N) 
return 9 - N; 
else 
return S$; 
} 


因为 R 是 2 的 整数 备 , 只 需要 将 对 的 取 模 和 除法 运算 转化 成 移 位 运算 , 就 可 以 得 到 真正 高 
效 的 模 乘 算法 。 蒙哥马利 约 分 算法 需要 为 计算 R 的 剩余 系 而 付出 一 些 额外 的 开销 , 因此 对 于 单 次 
模 乘 计算 ,蒙哥马利 约 分 算法 并 没有 优势 , 但 是 对 于 像 模 寡 运算 这 样 需要 多 次 反复 计算 模 乘 的 情 
况 ， 使 用 蒙哥马利 约 分 算法 可 以 极 大 地 提高 模 究 计算 的 速度 。 


292 BP 第 18 章 RSA 算 法 


加 密 与 签名 


18.1.3 “” 模 蝴 算法 


现在 可 以 使 用 蒙哥马利 约 分 算法 改造 18.1.1 节 给 出 的 模 寡 算法 。 首 先 要 利用 同 余 方程 计算 出 
7"， 然 后 再 将 模 寡 运算 的 底数 M 转换 到 尺 的 剩余 系 ， 并 用 “平方 - 乘 降 寡 法 ”逐次 计算 蒙哥马利 
模 乘 ， 最 后 将 蒙哥马利 模 乘 运算 的 结果 转 出 尺 的 剩余 系 ,得 到 最 终 的 结果 。 在 选择 尺 的 时 候 , 我 
们 取 大 值 为 32 的 整数 倍 ， 这 样 在 计算 蒙哥马利 约 分 算法 的 移 位 处 理 的 时 候 ， 对 于 我 们 的 大 整数 
CBigInt 来 说 ， 一 次 移动 一 个 unsigned int 大 数位 ， 速 度 更 快 。 最 后 给 出 使 用 蒙哥马利 算法 优化 
后 的 模 寡 算法 实现 : 


CBigInt ModularPower(const CBigInt& M, const CBigInt& E, const CBigInt& N) 
\ 
CBigInt R = 1; 
R <<= N.m nLength * 32; 
CBigInt Np = CongruenceEquation(R - N, R); 
// 转 换 到 尺 的 剩余 系 
CBigInt Mp = (M* R) % N; 
CBigInt D = R % N; 
for( int64 i = 0; i < E.GetTotalBits(); i++) 
{ 
if(E.TestBit(i)) 
{ 
D = MontgomeryReduction(D, Mp, Np, N, R); 
+ 
Mp = MontgomeryReduction(Mp, Mp, Np, N, R); 
} 
// 转 出 R 的 剩余 系 
D = MontgomeryReduction(D, 1, Np, N, R); 
return D; 
} 


18.1.4 ”素数 检验 与 米 勒 - 拉 宾 算法 


素数 在 数论 中 是 一 个 很 大 的 分 支 , 很 多 数学 定理 都 和 素数 有 关 , 有 人 甚至 将 其 独立 出 来 称 为 
素 论 , 可 见 素数 对 于 数学 的 重要 性 。RSA 算法 在 生成 密 钥 对 时 需要 两 个 随机 大 素数 , 并 将 它们 的 
乘积 作为 公共 模 数 n， 这 就 需要 有 对 应 的 素数 生成 算法 。 素 数 生 成 没有 什么 特殊 方法 ， 就 是 生成 
随机 大 数 作为 疑似 素数 ， 然 后 用 素数 检验 方法 检验 是 否 是 “ 真 ” 的 素数 ， 如 果 是 就 返回 结果 ， 如 
果 不 是 就 继续 上 述 过 程 。 由 此 可 见 ， 要 生成 一 个 素数 ， 必 须要 有 一 套 判断 素数 的 方法 。1000 以 
内 的 小 素数 可 以 用 素数 的 定义 直接 判断 , 大 素数 则 要 采用 特定 的 算法 进行 素性 测试 。 要 进行 素性 
测试 ， 先 来 了 解 一 下 费 马 小 定理 ,定义 如 下 : 

设 p 是 素数 ，a 是 任意 整数 ， 且 a l=0(modp), 则 a ?= 1(modp) 

一 般 来 说 ， 可 以 利用 费 马 小 定理 直接 进行 素数 测试 ， 这 就 是 费 马 测试 (Fermat )。 费 马 测试 
实际 上 是 利用 费 马 小 定理 的 逆 定 理 进 行 反 向 证 明 , 不 幸 的 是 ， 费 马 小 定理 只 是 素数 检验 的 必要 条 
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件 ， 甚 充分 条 件 ， 也 就 是 费 马 小 定理 的 道 定理 并 不 成 立 ， 因 为 存在 卡 米 歌 尔 数 ”( Carmichael )。 
费 马 测试 是 个 概率 测试 , 并 没有 得 到 广泛 的 应 用 , 目前 判断 大 素数 (特别 是 超过 512 位 的 大 素数 ) 
普遍 采用 的 方法 是 米 勒 - 拉 宾 (Miller-Rabin ) 算法 。 

1975 年 ， 卡 内 基 梅 隆 大 学 计算 机 系 的 米 勒 ( Gary Lee Miller ) 教授 首先 提出 了 基于 广义 黎 曼 
猜想 ?的 确定 性 算法 ， 由 于 广义 黎 曼 猜 想 并 没有 被 证 明 ， 直 接 引 用 广义 黎 曼 猜想 就 存在 理论 上 的 
缺陷 。 所 以 以 色 列 耶路撒冷 希 伯 来 大 学 的 拉 宾 (Michael O. Rabin ) 教授 对 其 进行 了 改进 , 提出 了 
不 依赖 于 该 假设 的 随机 化 算法 , 这 就 是 米 勒 - 拉 宾 算法 的 由 来 。 米 勒 - 拉 宾 素性 检验 算法 利用 随机 
化 算法 判断 一 个 数 是 合 数 还 是 可 能 是 素数 ,请 注意 , 这 里 用 词 是 “可 能 ”， 因 为 米 勒 - 拉 宾 算法 也 
是 一 种 判断 素性 的 概率 算法 。 虽 然 是 概率 算法 ， 如 果 加 上 限制 条 件 ， 米 勒 - 拉 宾 算法 也 可 以 作为 
一 种 确定 性 算法 。 

用 米 勒 - 拉 宾 素性 检验 法 检验 算法 判断 n 是 否 是 素数 ,首先 将 -1 分 解 为 m*2*, 然 后 在 [1,n-1] 
区 间 上 随机 选 一 个 整数 a， 对 于 [0, 二 可 区 间 中 的 每 一 个 值 >， 检 测 : 


da"(mod n)z1 和 a”? (mod 门 关 -1 

两 个 条 件 是 否 同时 成 立 ， 如 果 两 个 条 件 同 时 成 立 ， 则 n 是 一 个 合 数 ， 否 则 ，n 有 75% 的 概率 是 一 
个 素数 。 有 此 可 知 ， 做 一 次 检验 ， 即 便 不 满足 两 个 成 为 合 数 的 条 件 ， 仍 然 有 1/4 的 可 能 性 是 合 
数 。 但是， 如 果 用 足够 多 的 随机 数 a 对 其 进行 多 次 检验 ， 则 可 以 降低 n 是 合 数 的 可 能 性 。 假 设 检 
验 次 数 是 :， 则 n 是 合 数 的 可 能 性 是 P(c) = 1/4。 如 果 进 行 5 次 检验 都 符合 上 述 情 况 ，n 是 合 数 的 
可 能 性 就 降 到 0.098%， 即 xn 有 99.9% 的 可 能 是 素数 。 如 果 进 行 10 次 检验 ， 则 n 是 素数 的 可 能 性 
就 达到 99.9999%。 用 米 勒 - 拉 宾 算法 检验 素数 ， 一般 至 少 需 要 检验 5 次， 严格 的 场合 可 能 需要 检 
验 更 多 的 次 数 ， 比 如 50 次 。 

MillerRabinHelper() 函 数 是 一 次 米 勒 - 拉 宾 检验 的 算法 实现 , 其 中 m 和 上 两 个 参数 需要 实现 计 
算出 来 ,计算 的 方法 将 在 MillerRabin() 函 数 中 给 出 。 根 据 检 验 规则 的 定义 ， 需 要 计算 a 与 m 关 
于 的 模 符 ， 以 及 a 与 mx2’ 关 于 的 模 罕 ， 根 据 窜 运算 关系 的 特点 ，a 的 mx2" 次 方 与 4 的 m 次 
方 存在 平方 的 关系 。 如 果 令 5= a”， 则 a 的 mx2 次 方 就 是 妨 ， 则 a 的 mx4 次 方 就 是 六， 以 此 类 
推 。 如 果 采 用 女 的 累积 ， 可 以 减少 很 多 计算 量 ， 因 此 ， 一 般 算 法 实现 都 会 采用 六 的 累积 代替 计 
算 4 的 max2 "次 方 , 应 L1lerRabinHelper() 函 数 也 不 例外 。 


@ 卡 米 鞭 尔 数 : 能 满足 费 马 小 定理 ， 但 是 又 不 是 素数 的 数 。 

@ 德国 数学 家 歼 曼 在 1858 年 写 了 一 篇 只 有 8 页 长 的 关于 素数 分 布 的 论文 ， 提 出 了 著名 的 广义 黎 曼 猜想 (Riemanns 
Hypothesis )。 这 个 猜想 是 指 黎 曼 5 函数 (5 音 : 齐 塔 ): ts)=Z1n^s (n 从 1 到 无 穷 大 ) 的 非 平 凡 零 点 都 在 Re(s)= 1/2 
的 直线 上 ( 也 就 是 说 所 有 非 平凡 零点 的 实 部 都 是 1/2 )。 看 似 简单 的 问题 实际 上 并 不 容易 ， 求 多 项 式 的 零点 ， 特 别 
是 求 代数 方程 的 复 根 都 不 是 简单 的 问题 。 数 学 家 把 复 平 面 上 Re(s) = 1/2 的 直线 称 为 临界 线 ( Critical Line )。1914 

FE， 英国 数学 家 哈代 ( GH. Hardy ) 首先 证 明 这 条 临界 线 上 有 无 穷 个 零点 。 三 位 荷兰 数学 家 利用 计算 机 对 最 初 的 

Z 个 5 函数 的 零点 进行 检验 ， 目 前 已 经 证 明了 2/5 的 复 零点 都 在 这 条 直线 上 ， 并 且 在 这 条 直线 之 外 至 今 还 没有 

发 现 其 他 复 零 点 。 这 初步 证 明 黎 曼 的 假设 是 对 的 ， 但 是 这 个 检验 的 过 程 还 在 继续 ， 因 此 ,广义 黎 曼 猜想 是 对 还 是 

错 还 没有 定论 。 


pp 


副 
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bool MillerRabinHelper(const CBigInt& a, const CBigInt& m, int k, const CBigInt& n) 


{ 
CBigInt b = ModularPower(a, m, nN); 


if(b !-= 1) 
{ 
for(int r = 0; r < k; r++) 
{ 
if(b 1!= (n - 1)) //b != 1 && b 1!= n-1， 满 足 合 数 条件 
{ 
return false; 
} 
b = ModularPower(b, 2, Nn); 
} 


} 
return true; 
} 

MillerRabinHelper() 消 数 返回 false 表示 nn 不 是 素数 ， 返 回 true 表示 n 有 75% 的 可 能 是 一 个 
素数 。 当 MillerRabinHelper() 孙 数 返 回 true 时 , 需要 使 用 新 的 随机 数 a 对 n 继续 检验 ， 直 到 满足 
检验 次 数 条 件 。MillerRabin() 函 数 首先 根据 对 计算 出 m 和 然后 多 次 调用 MillerRabinHelper() 
函数 进行 检验 。 产 生 随 机 数 a 的 时 候 ， 总 是 选 一 个 32 位 以 内 的 小 随机 数 ， 目 的 是 减少 检验 的 计 
算 量 。a 的 二 进 制 位 数 总 是 比 n 少 一 位 ， 且 最 大 不 超过 32 位 ,保证 a 总 是 小 于 或 等 于 n -1。 


int MillerRabin(const CBigInt& n) 


{ 

CBigInt m= n - 4; 

int k = 0; 

// 根 据 n-1 = mx2^kK， 计 算 m 和 kk 

while(!m.TestBit(0)) 

{ 
m>>= 1; //m= m/ 2; 
k++; 

} 

CBigInt a,b; 

for(int i = 0; ic M R TEST COUNT; i++) 

{ 
__ int64 nbits = n.GetTotalBits(); 
//1<=a<=n-1 
a = CBigInt::GenRandomInteger((nbits > 32) ? 32 : nbits - 1) + 1; 
if(!IMillerRabinHelper(a, m, k, n)) 
{ 

return 0;// 测 试 失败 ， 明 确 是 合 数 

} 

} 

return 1; 

} 


前 面 介绍 过 , 米 勒 - 拉 宾 检验 算法 是 一 个 概率 方法 , 但 是 如 果 加 上 限制 条 件 , 米 勒 - 拉 宾 算法 
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也 可 以 作为 一 种 确定 性 算法 使 用 。 限 制 条 件 就 是 数 的 范围 。 根 据 数 学 家 的 证 明 ， 只 要 用 2 和 3 作 
为 随机 数 进行 两 次 检验 ， 就 可 以 100% 正 确 地 检验 小 于 1373653 的 所 有 素数 。 再 比如 ， 只 要 用 2、 
3、5、7、11 作为 随机 数 进行 5 次 检验 ,就 可 以 100% 正 确 地 检验 小 于 2152302898747 的 所 有 素数 。 
这 些 经 过 证 明 的 经 验 值 都 是 100% 正 确 的 , 但 是 不 在 上 述 范 围 中 的 其 他 大 素数 的 判断 , 目前 还 只 能 
是 概率 结果 ， 也 就 是 说 ， 即 使 能 通过 检验 ， 也 要 打上 “ 伪 素 数 ” 的 标签 。 


18.2 RSA 算法 原理 


传统 的 加 密 模式 一 般 是 信息 发 送 者 用 特定 的 密 钥 对 信息 加 密 ( 加 密 和 解密 算法 都 是 公开 的 )， 
然后 将 密 文 传递 给 接收 者 , 同时 还 要 将 密 钥 告 诉 接 收 者 , 这 样 接收 者 就 可 以 用 密 钥 对 密 文 进行 解 
密 。 这 种 方式 的 隐患 在 于 密 钥 的 传递 ， 密 钥 在 传递 过 程 中 有 可 能 被 截取 ， 此 外 ， 密 钥 分 发 出 去 以 
后 就 很 难 控制 分 发 的 范围 ， 一 旦 失控 ， 发 出 去 的 加 密 信 息 就 等 于 是 明文 了 。 

1976 年 ， 维 特 菲尔德 迪 菲 ( Whitfield Diffie ) 和 马丁 … 赫 尔 曼 ( Martin Hellman ) 在 一 篇 革 
命 性 文章 “密码 学 的 新 方向 ”( New Directions in Cryptography ) 一 文中 提出 了 一 种 使 用 非 对 称 密 
钥 的 密码 学 新 方法 ,可 以 在 不 用 传递 密 钥 的 情况 下 完成 信息 的 加 密 和 解密 。 这 就 是 现代 非 对 称 公 
钥 体系 的 基础 , 在 这 种 体系 中 , 发 送 者 要 给 接收 者 传递 密 文 , 首先 要 得 到 接收 者 对 外 发 布 的 公 钥 ， 
然后 用 该 公 钥 加 密 信息 , 并 将 加 密 的 信息 发 送 给 接受 者 。 接 收 者 受到 密 文 后 用 自己 的 私 钥 对 信息 
解密 ， 在 这 个 过 程 中 ， 不 需要 密 钥 传递 ， 接 受 者 的 私 钥 自己 保管 ， 不 对 外 公开 。 


这 种 思想 也 对 密码 学 家 提出 了 新 的 挑战 , 也 鼓舞 了 很 多 数学 家 寻找 一 种 满足 非 对 称 公 钥 体 系 
的 加 密 算法 。 第 二 年 ,美国 麻 省 理工 学 院 的 罗 纳 德 .李维斯 特 (Ron Rivest )、 阿 迪 “' 萨 莫 尔 ( Adi 
Shamir ) 和 伦 纳 德 : 阿 德 曼 (Leonard Adleman ) 三 位 研究 员 在 “实现 数字 签名 和 公 钥 密码 体制 的 
一 种 方法 ”一 文中 首次 提出 了 一 种 非 对 称 公 钥 加 密 算法 ,因为 三 个 人 的 姓氏 首 字 符 分 别 是 R、S、 
A， 这 种 算法 就 被 命名 为 RSA 算法 。 经 过 四 十 多 年 的 发 展 ，RSA 算法 已 经 成 为 现代 非 对 称 公 角 
体系 中 最 基本 也 是 目前 应 用 最 广泛 最 有 影响 力 的 公 钥 加 密 算法 。 


18.2.1 RSA 算法 的 数学 理论 


在 研究 RSA 算法 的 数学 原理 之 前 ， 先 来 介绍 几 个 数学 概念 。 首 先是 “ 同 余 ”， 假定 三 个 整数 
a、b 和 n(n 关 0)， 如 果 a 和 4。 的 差 是 n 的 整数 倍 ， 则 称 a 在 模 n 时 与 5 同 余 ， 记 做 a=b(mod n)。 
可 以 将 同 余 简 单 理 解 为 等 式 ，a-b=kn, 上 为 任意 整数 。 然 后 是 “ 欧 拉 函 数 ”"， 欧 拉 函 数 y(n) 定 义 
为 所 有 小 于 或 等 于 n, 且 与 n 互 泰 的 正 整数 的 个 数 ,，g(n) 的 值 又 被 称 为 n 的 欧 拉 数 。 以 8 为 例 , 1、 
3、5、7 都 与 8 互 素 ， 所 以 就 有 gp(8)=4。 当 n 是 素数 时 ，g(n)=n-1， 因 为 所 有 比 n 小 的 数 都 与 它 
互 素 。 欧 拉 函 数 还 有 一 个 特性 ， 当 n 可 以 分 解 为 两 个 互 素 的 数 的 乘积 时 n 的 欧 拉 函 数 就 是 两 个 因 
子 的 欧 拉 函数 的 乘积 , 即 g(n)= op(pq)=p(p)p(9)=(p-1)(q-1)。 最 后 是 “乘法 道 元 ”, 若 abp=1(modn)， 
则 称 2 为 a 在 模 n 的 乘法 逆 元 ,，b 可 以 表示 为 al。 第 17 章 已 经 介绍 过 ， 可 以 使 用 欧 拉 算 法 求解 
乘法 逆 元 ， 相 关 算 法 的 实现 在 第 17 章 已 经 给 出 。 


296 > 第 18 章 RSA 算法 加 密 与 签名 


RSA 算法 基于 一 个 十 分 简单 的 数论 事实 : 将 两 个 大 素数 相 乘 十 分 容易 , 但 那 时 想 要 对 其 乘积 
进行 因 式 分 解 却 极其 困难 ,因此 可 以 将 乘积 公开 作为 加 密 密 钥 的 一 部 分 。 由 此 可 知 ， 密 钥 的 生成 
是 RSA 算法 的 核心 ， 先 来 看 看 RSA 密 钥 对 的 生成 过 程 。 

(1) 任意 选择 两 个 大 素数 ，p 和 ， 计 算出 n=pxqg，n 又 被 称 为 RSA 算法 的 公共 模 数 。 

(2) 计算 的 欧 拉 数 g(n)=(p - 1)(g - 1)。 

(3) 随机 选择 加 密 密 钥 指数 , 从 [0,p(n) - 1] 中 选择 一 个 与 g(n) 互 质 的 数 e 作 为 公开 的 加 密 指 数 。 

(4) 求解 与 e 对 应 的 解密 指数 4，d 和 e 满足 条 件 : (dx e)=1 mod p(n)。 因 为 e 和 gp(n) 互 素 ， 
此 可 以 利用 扩展 欧 几 里 得 算法 求解 同 余 方 程 ， 得 到 唯一 整数 解 d。 

(5) 销毁 P 和 7， 妥善 保存 私有 密 钥 SK=(d, n)， 将 公开 密 钥 PK=(e, n) 分 发 给 希望 给 你 发 送信 
息 的 人 。 

由 以 上 过 程 可 知 , 在 p 和 g 不 可 知 的 情况 下 , 要 得 到 私有 密 钥 的 解密 指数 4， 必须 知道 p(n)， 
而 g(n) 必 须 通 过 第 2 步 给 出 的 方法 计算 ,也 就 是 说 ， 必 须要 分 解 公共 模 数 nx， 重新 得 到 p 和 gq。 
对 n 的 分 解 是 个 数学 难题 ， 目 前 没有 有 效 的 方法 可 以 快速 分 解 n，n 越 大 越 难 分 解 ， 这 就 是 RSA 
算法 的 数学 原理 。 以 目前 计算 机 的 处 理 能 力 ， 当 大 到 一 定 的 程度 ， 可 以 认为 是 不 可 分 解 的， 这 
也 是 RSA 算法 安全 性 的 基本 保证 。 


18.2.2” ”加密 和 解密 算法 


RSA 算法 的 加 密 和 解密 其 实 就 是 模 宕 运算 ,这 也 是 我 为 什么 说 RSA 算法 简单 的 原因 ， 因 为 
18.1 节 已 经 给 出 了 加 密 和 解密 的 算法 实现 代码 ， 就 是 ModularPower() 函 数 。 假 设 M 是 明文 ， C 是 
密 文 ， 加 密 的 过 程 就 是 : 


C= M’ mod n) 


M= C1 (mod n) 

现在 举 个 经 典 的 密码 学 示例 来 解释 一 下 RSA 加 密 和 解密 的 过 程 。 爱 丽 丝 希望 鲍 勃 给 她 发 送 
的 信息 进行 加 密 ， 她 首先 选择 两 个 素数 p=11 和 g=13， 计 算 它们 的 乘积 ， 得 到 公共 模 数 n=143， 
同时 计算 出 的 欧 拉 数 g(n)=120。 接 下 来 爱丽 丝 需 要 选择 一 个 小 于 119( p(n) - 1=119 ), 且 与 p(n) 
互 素 的 数 作为 加 密 指数 e， 爱 丽 丝 选择 e=7。 然 后 爱丽 丝 需 要 求解 同 余 方 程 74= 1 mod 120，, 得 到 
太 103。 最 后 ， 爱 丽 丝 销毁 己 和 4, 将 (7,143) 作 为 公开 密 钥 发 送 给 鲍 勃 ,将 (103,143) 作 为 私 钥 自己 
保存 。 鲍 勃 需 要 发 送信 息 M=85 给 爱丽 丝 , 他 先 用 爱丽 丝 的 公 钥 对 M 进行 加 密 , 得 到 密 文 C= 85” 
(mod 143) = 123 ， 然 后 将 密 文 C=123 发 送 给 爱丽 丝 ， 爱 丽 丝 得 到 C 后 ， 用 私 钥 对 C 进行 解密 ， 
得 到 明文 M=123'™ (mod 143)=85。 


以 上 就 是 整个 RSA 加 密 和 解密 的 过 程 ， 其 核心 就 是 模 寡 运算 ， 使 用 的 过 程 很 简单 ， 但 是 简 
单 并 不 意味 着 不 安全 ， 接 下 来 要 介绍 一 下 RSA 算法 的 安全 性 。 
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18.2.3 RSA 算法 的 安全 性 


人 们 在 提 到 RSA 加 密 的 时 候 , 都 会 附带 一 个 很 重要 的 参数 ,就 是 RSA 密 钥 长 度 ， 比 如 1024 
比特 的 RSA 密 钥 ，2048 比特 的 RSA 密 钥 等 。 这 里 的 1024 和 2048 实际 上 是 RSA 密 钥 中 公共 模 
数 n 的 二 进 制 位 长 度 , n 越 大 就 越 难 分 解 , 这 就 是 通常 人 们 会 认为 1024 比特 的 RSA 密 钥 要 比 512 
比特 的 RSA 密 钥 更 安全 的 原因 。 但 是 从 数学 上 看 这 个 问题 ,对 n 的 分 解 并 没有 被 证 明 是 NP 问题 ， 
也 就 是 说 ， 增 加 的 长 度 就 能 提高 安全 性 还 没有 被 用 数学 的 方法 证 明 ( 当然 ， 也 没有 被 证 伪 )。 
当然 , RSA 加 密 的 安全 性 是 由 很 多 因素 决定 的 ， 比 如 组 成 n 的 两 个 随机 素数 p 和 gq 的 选择 就 很 有 
讲究 。p 和 g 必须 是 随机 生成 的 强 素数 ， 绝 对 不 能 用 别人 用 过 的 素数 ， 或 者 从 某 个 素数 表 中 选择 
了 和 gqg。p 和 g 的 差 值 应 该 尽量 大 ， 增 加 分 解 n 计算 的 难度 。 

加 密 指数 e 的 选择 也 很 重要 ，e 越 大 计算 量 就 越 大 ， 为 了 加 快 加 密 计 算 的 速度 ，RSA 算法 对 
公 钥 e 选 择 通 常 是 3、5、17、257 或 65537。X.509 证 书 体系 建议 使 用 65537，PEM 建议 使 用 3， 
PKCS#1 建议 使 用 3 或 65537。 但 是 使 用 太 小 的 e 会 引入 小 指数 攻击 问题 ， 在 原始 数据 中 填充 随 
机 数值 ， 使 得 m* (mod n) 关 m*， 可 以 有 效 地 抵抗 小 指数 攻击 。 因 此 使 用 RSA 加 密 数 据 通 常 都 会 

间 定 随机 值 填 充 模 式 ， 单 纯 的 直接 用 模 寡 算法 加 密 数据 是 不 安全 的 。 

除 此 之 外 ， 还 有 针对 明文 破解 的 选择 密 文 攻击 方式 。 攻 击 者 知道 了 A 的 公开 密 钥 (e, n)， 同 
时 截获 了 用 A 的 公 钥 加 密 的 信息 7= 凶 (mod n)。 攻 击 者 首先 选择 一 个 rr < 门 ,计算 页 = (modn)， 
这 意味 着 用 A 的 私 钥 对 五 解 密 可 得 到 xr， 即 r= 蕊 *(mod 门 。 接 下 来 ， 攻 击 者 计算 到 = YXY (mod 
n), 求解 + 的 模 n 乘法 逆 元 1= 让 (mod n)。 因 为 r= YI? (modn)， 所 以 1= 了 (modn)。 现在， 攻 
击 者 以 验证 身份 的 名 义 将 丈 发 给 A, 请 A 对 消息 肪 签名 ,于 是 得 到 5S= "(modn)。 最 后 ,攻击 
者 做 以 下 计算 : 


txS= (YY, )(mod n) 
将 五 = YX7 (mod n) 代 入 上 式 得 到 : 
txS=(Y” "modn)=(Y* Y FV) (modn)=Y (modn)= 
最 终 攻 击 者 在 不 知道 入 有 密 钥 4 的 情况 下 得 到 了 明文 X。 
以 上 选择 密 文 攻击 过 程 关 键 的 一 步 就 是 攻击 者 需要 骗取 A 对 丈 进 行 签名 ， 只 要 用 户 A 不 对 
来 历 不 明 的 数据 直接 签名 ， 就 可 以 阻 断 这 种 攻击 。 实 际 上 ，RSA 的 签名 是 不 对 数据 直接 计算 的 ， 
而 是 像 加 密 一 样 要 填充 一 些 随 机 数值 ， 具 体 的 签名 算法 请 看 18.4 节 的 介绍 。 


18.3 ”数据 块 分 组 加 密 


前 面 我 们 讨论 了 RSA 加 密 的 数学 原理 和 加 密 解 密 过 程 的 算法 实现 , 但 是 所 给 出 的 算法 实现 
还 都 是 在 数学 领域 的 大 数 计算 , 怎么 将 其 应 用 到 现实 生活 领域 呢 ?” 加 密 和 解密 领域 最 典型 的 问题 
就 是 对 数据 分 组 加 密 ，RSA 同样 支持 对 数据 分 组 加 密 。 和 DES、AES 这 样 的 分 组 加 密 算法 不 同 ， 
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RSA 算法 所 支持 的 每 个 数据 分 组 的 大 小 不 仅 与 RSA 密 钥 长 度 有 关 ， 还 和 数据 分 组 的 填充 模式 
( padding scheme ) 有 关 。 填 充 模 式 是 和 RSA 算法 安全 性 相关 的 内 容 ， 不 同 的 填充 方式 需要 插入 
原始 数据 中 的 padding 数据 量 不 一 样 ， 因 此 会 影响 数据 分 组 中 有 效 载 荷 的 大 小 。 

RSA 算法 有 多 种 填充 模式 ， 常 用 的 填充 模式 有 PKCS #1 1.5 和 OAEP 两 种 ,我 们 将 在 后 面 介 
绍 这 两 种 填充 模式 , 这 里 只 给 出 使 用 两 种 填充 模式 对 原始 数据 载荷 大 小 的 影响 。RSA 加 密 算法 每 
个 数据 分 组 的 有 效 载荷 大 小 与 密 钥 长 度 和 填充 模式 的 关系 如 表 18-1 所 示 。 


表 18-1 RSA 填 充 模式 与 数据 分 组 大 小 关系 表 


填充 模式 RSA 密 钥 长 度 〈 位 ) 输入 分 组 有 效 载 荷 〈 字 节 ) 输出 分 组 长 度 〈 字 节 ) 
PKCS #1 1.5 768 85 96 
PKCS #1 1.5 1024 117 128 
PKCS #1 1.5 2048 245 256 
OAEP 768 54 96 
OAEP 1024 86 128 
OAEP 2048 214 256 


18.3.1 ” 字 节 流 与 大 整数 的 转换 


被 加 密 的 数据 可 以 理解 为 字 节 流 ， 对 数据 加 密 时 ， 除 了 按照 表 18-1 给 出 的 输入 分 组 有 效 载 
荷 大 小 对 字 节 流 进行 分 组 外 ， 还 要 将 分 组 后 的 数据 转换 成 大 整数 才能 进行 RSA 加 密 运 算 。 完 成 
加 密 运 算 后 ,还 要 将 计算 得 到 的 大 整数 转换 成 字 节 流 数 据 , 这 样 才能 进行 存 入 文件 或 通过 网 络 传 
送 。 解 密 的 过 程 与 之 类 似 ， 都 需要 一 套 大 整数 与 字 节 流 互相 转换 的 方法 ， 这 样 RSA 算法 才 具 有 
实用 性 。 

其 实 将 加 密 数 据 转换 成 大 数 对 象 的 方法 非常 朴实 无 华 , 如 果 将 大 数 也 看 成 按照 顺序 在 内 存 中 
存放 的 字 节 流 ， 这 种 转换 就 一 目 了 然 。 只 要 逐 字 节 将 加 密 数 据 转换 成 CBigInt 类 的 大 数位 数组 
(m_ulValue ), 并 正确 设置 大 数位 的 位 数 (m_nLength )， 即 可 完成 加 密 数 据 转换 成 大 数 对 象 的 过 程 。 
反之 亦 然 ， 只 要 将 cBigInt 类 的 大 数位 数组 中 的 数据 和 逐 字 节 转换 到 指定 的 缓冲 区 ， 即 完成 大 数 对 
象 转换 成 字 节 流 数 据 的 过 程 。 转 换 过 程 唯 一 需要 注意 的 是 对 数据 中 0 的 特殊 处 理 ， 对 于 CBigInt 
大 数 对 象 来 说 ， 最 高 的 大 数位 不 能 是 0， 如 果 是 0， 则 要 调整 m_nLength。 


18.3.2 PCKS 与 OAEP 加 密 填 充 模 式 


18.2.3 节 介 绍 RSA 算法 的 安全 性 时 , 提 到 为 了 对 抗 小 指数 攻击 , 需要 在 原始 数据 中 添加 随机 
填充 数据 以 提高 RSA 的 安全 性 。 常 用 的 填充 模式 有 PKCS#1 1.5 和 OAEP 两 种 ，PKCS 的 全 称 是 
公 钥 加密 标准 (Public-Key Cryptography Standards )， 是 RSA 实验 室 发 布 的 一 个 标准 。OAEP 的 
全 称 是 最 优 非 对 称 加 密 填 充 (Optimal Asymmetric Encryption Padding )， 是 一 个 比 PKCS # 1.5 新 
的 填充 标准 ， 被 PKCS 坟 2.0 接受 为 新 的 填充 标准 。 理 论 上 OAEP 有 比 PKCS #1 1.5 更 好 的 安全 
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性 ， 但 是 从 兼容 性 来 说 ，PKCS #1 1.5 具有 更 好 的 兼容 性 。 


从 表 18-1 可 以 看 出 ，PKCS #1 1.5 需要 额外 的 11 字 节 进行 随机 填充 ， 而 OAEP 需要 额外 的 
42 字 节 用 于 随机 数据 填充 , 而且 OAEP 的 填充 方式 更 具 随机 化 特性 , 由 此 可 知 ，OAEP 填充 方式 
对 原始 数据 造成 的 混乱 程度 ( 炳 值 ) 比较 大 ， 具 有 更 好 的 安全 性 。 这 里 的 更 好 是 相对 的 ， 并 不 是 
说 PKCS #1 1.5 填充 方式 不 安全 。 当 你 在 两 个 不 同 的 系统 之 间 传 递 RSA 加 密 的 信息 时 , 填充 模式 
的 兼容 性 就 是 需要 特别 注意 的 地 方 ，PKCS #1 1.5 因为 发 布 得 早 ， 应 用 更 广泛 一 些 ， 兼 容 性 就 更 
好 一 些 。 

前 面 提 到 PKCS #1 1.5 需要 额外 的 11 字 节 进行 随机 数据 填充 , 实际 上 是 不 完全 正确 的 。 只 有 
当 数 据 的 有 效 和 载荷 足 够 多 的 时 候 ，PKCS #1 1.5 填充 的 长 度 才 被 压缩 为 11 字 节 ， 当 有 效 和 载荷 不 足 
的 时 候 ， 实 际 需要 填充 的 数据 会 超过 11 字 节 。 总 的 来 说 ，PKCS #1 1.5 填充 可 以 分 为 四 部 分 , 分 
别 是 一 字 节 前 导 0, 一 字 节 标 志 T 和 大 -|M -3 字 节 的 随机 数据 和 一 字 节 的 截断 符号 0。 Kk 是 RSA 
密 钥 公 共 模 数 的 字 节 长 度 ，|M| 表 示 实 际 载荷 数据 长 度 ，|MI 通 常 要 满足 Mk-11， 当 IM|=k--11 
的 时 候 ，PKCS #1 1.5 要 求 的 最 小 填充 长 度 是 11 字 节 时 ， 其 结构 如 图 18-1 所 示 : 
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[= 
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图 18-1 PKCS #1 1.5 填充 模式 


其 中 标志 字 节 了 表示 拼凑 填充 数据 的 方法 ， 如 果 了 是 0， 表示 填充 数据 己 全 部 是 0; 如 果 了 是 1， 
表示 填充 数据 己 全 部 是 0xFF; 如 果 了 是 2, 表示 填充 数据 是 大 |MF-3 个 1-0xFF 之 间 的 随机 数据 。 
前 导 位 设 为 0 是 为 了 保证 转换 后 得 到 的 大 数 是 正 数 ， 这 大 |MI| 字 节 的 填充 数据 放 在 实际 的 数据 载 
荷 之 前 ， 构 成 完整 的 加 密 数 据 分 组 ， 然 后 转换 成 大 整数 进行 加 密 计算 。 对 加 密 过 的 数据 解密 时 ， 
解密 计算 后 得 到 的 数据 也 是 包含 填充 数据 的 ， 要 从 中 提取 出 有 效 数据 载荷 ， 其 方法 就 是 从 前 导 0 
和 标志 了 开始 向 后 搜索 ， 直 到 找到 截断 0 标志 为 止 〈 随机 填充 数据 不 会 是 0 )， 在 这 之 间 的 都 是 
填充 数据 ， 剩 下 的 就 是 有 效 数 据 载 荷 。 
相对 于 PKCS #1 1.5 来 说 ，OAEP 稍 显 复杂 一 点 。OAEP 是 Mihir Bellare 和 Philip Rogaway 
两 位 密码 学 家 提出 的 一 种 加 密 方案 , 后 来 被 PKCS #1 2.0 接受 为 标准 , 因此 也 被 称 为 PKCS #1 2.0 
填充 方案 。OAEP 模式 中 明文 载荷 的 长 度 |MI 要 满足 MI 大 和 2nLen-2， 其 中 hLen 是 OAEP 模式 所 
选择 的 哈 希 函数 的 输出 长 度 。OAEP 模式 的 哈 希 函数 和 撼 码 生 成 函数 都 不 是 固定 的 ， 可 以 通过 参 
数 化 配置 和 选择 ， 如 果 选 择 SHA (Secure Hash Algorithm )， 输 出 长 度 是 20 字 节 ， 则 明文 载荷 不 
能 超过 -42 字 节 。OAEP 模式 需要 指定 一 个 与 明文 有 关联 的 标签 L， 如 果 没 有 指定 ， 则 默认 世 
是 空 。OAEP 的 加 密 过 程 如 下 。 

(1) 计算 标签 工 的 哈 希 输出 ， 得 到 一 个 长 度 为 hLen 的 字 节 串 IHASH=HASH(7); 

(2) 生成 一 字 节 串 PS， 内 容 是 0， 长 度 为 -|MI -2hLen -2 字 节 。 当 MI=K- 2hLen- 2 时 ， 
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PS 长 度 有 可 能 是 0; 

(3) 连接 IHASH，PS， 一 字 节 的 0x01 和 明文 M， 得 到 一 个 上 - hLen -1 字 节 长 度 的 字 节 流 
DB= IHash|PS|0x01|M; 

(4) 生成 一 个 长 度 为 hLen 的 随机 字 节 串 seed ,并 使 用 掩 码 生 成 函数 将 其 转换 为 长 度 大 hLen-l1 
字 节 的 掩 码 DBmask，DBmask= MGF(seed, 大- hLen -1); 

(5) 用 DBmask 与 DB 做 掩 码 计算 得 到 mDB=DB @DBmask; 

(6) 用 掩 码 生 成 函数 将 mDB 转 换 为 长 度 为 hLen 字 节 的 掩 码 seedMask, 将 其 与 随机 字 节 串 seed 
做 掩 码 计算 ， 得 到 Mseed。 即 seedMask=MGF(mDB, hLen), mSEED= seed @seedMask; 

(7) 将 一 字 节 的 0x00、mSEED 和 mDB 拼 在 一 起 ， 组 成 长 度 为 大 的 加 密 数 据 分 组 EM， 即 
EM=0x00ImSEEDImDB ， 然 后 将 EM 转换 为 大 整数 即 可 进行 RSA 加 密 计 算 。 


OAEP 解密 的 过 程 与 加 密 过 程 相反 ， 首 先 要 将 加 密 数 据 转 换 成 大 整数 ， 进 行 RSA 解密 计算 ， 
然后 将 解密 后 的 大 整数 转换 成 字 节 流 ， 此 时 就 得 到 加 密 过 程 第 7 步 拼接 的 数据 分 组 EM， 然 后 再 
按照 以 下 过 程 分 解 出 原始 加 密 数 据 M。 


(1) 计算 标签 工 的 哈 希 输出 ， 得 到 一 个 长 度 为 hLen 的 字 节 串 IHASH=HASH(D); 

(2) 从 EM 中 分 解 出 mSEED 和 mDB， 用 掩 码 生 成 函数 将 mDB 转换 为 长 度 为 hLen 字 节 的 掩 
人 码 seedMask， 即 seedMask=MGF(mDB, hLen); 

(3) 计算 seed=mSEED @seedMask， 然后 用 掩 码 生成 函数 将 其 转换 成 长 度 为 £-hLen-1 字 节 的 
掩 码 DBmask, DBmask= MGF(seed, khLen -1); 

(4) 根据 DBmask 和 mDB 计算 得 到 DB，DB=mDB@DBmask， 如 果 解 密 计算 过 程 没有 错误 ， 
DB 的 内 容 应 该 和 加 密 过 程 第 (3) 步 得 到 的 DB 是 一 样 的 ; 

(5) 分 解 DB， 首 先 匹配 一 下 IHash 与 第 1 步 算出 来 的 是 否 一 致 ， 如 果 不 一 致 说 明 解 密 错 误 。 
如 果 一 致 ， 则 匹配 一 连 串 0 和 一 个 0x01， 如 果 能 匹配 ， 则 剩 下 的 就 是 原始 明文 M， 如 果 不 能 匹 
配 ， 说 明 解 密 错误 。 


18.3.3 ”数据 加 密 算 法 实现 


分 组 数据 的 加 密 过 程 , 实际 上 是 一 个 和 填充 模式 捆绑 在 一 起 对 数据 进行 处 理 的 过 程 。 现 在 就 
以 简单 的 PKCS #1 1.5 填充 模式 为 例 ， 说 明 一 下 RSA 分 组 数据 加 密 过 程 。 这 个 过 程 正如 
Rsa_pkcs15 _Encrypt_Block() 函 数 所 展示 的 那样 , 首先 是 填充 前 导 0, 然后 是 了 标识 , 我 们 选择 7=2， 
这 也 是 PKCS # 1.5 推荐 的 模式 。 接 下 来 是 随机 字 节 串 ， 长度 由 大- MI -3 计算 得 到 ， 
GeneratePkcsPad() 消 数 产 生长 度 为 pad_len 的 随机 字 节 串 。 在 拼接 原始 数据 之 前 ， 还 要 再 添加 一 
个 截断 标识 0。 完 成 填充 之 后 ， 将 数据 转化 成 大 整数 ， 用 模 帘 运算 进行 加 密 ， 得 到 密 文 大 数 c， 
将 c 转 换 成 字 节 串 ， 即 可 作为 加 密 后 的 数据 进行 存储 或 分 发 。 


int Rsa Pkcs15 Encrypt Block(CBigInt& e, CBigInt& n, int kbits, 
void *pSrcBlock, int srcSize, CBigInt& c) 


{ 
int k = kbits / 8; 
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int pad len = k - srcSize - 3; 


char *padBlock = new char[k]; 
if(padBlock == NULL) 
return -1; 


padBlock[0] = 0x00; 

padBlock[1] = 0x02; // 填 充 随机 数 

Generatepkcspad(2, padBlock + 2, pad len); 
padBlock[pad len + 2] = Ox00; 

memcpy(padBlock + k - srcSize, pSrcBlock, srcSize); 
CBigInt em; 

em.GetFromData(padBlock, k);//0S2IP 

c = ModularPower(em, e, nN); 


delete[] padBlock; 


return k; 


} 
18.3.4 数据 解密 算法 实现 


分 组 数据 的 解密 过 程 也 是 和 填充 模式 捆绑 在 一 起 的 处 理 过 程 。 首先 将 得 到 的 密 文 转换 成 大 整 
数 c， 然 后 对 c 进 行 模 寡 运算 解密 ， 得 到 密 文 em ， 最 后 将 em 转换 成 字 节 串 ， 并 分 离 出 随机 填充 
言 息 ， 得 到 原始 明文 信息 。Rsa_pPkcs15 Decrypt_Block() 函 数 展示 的 就 是 分 组 解密 的 实现 过 程 ， 其 
中 分 离 填充 信息 需要 用 到 截断 标识 , 就 是 插入 到 随机 填充 字 节 串 和 原始 数据 之 间 的 那个 0。PKCS 
#1 1.5 要 求 填充 的 随机 字 节 都 是 1~0xFF 的 数值 ， 因此， 从 填充 标识 7 了 开始 搜索 ， 遇 到 的 第 一 个 0 
肯定 就 是 截断 标识 ， 其 后 跟 的 就 是 原始 数据 。 


int Rsa Pkcs15 Decrypt Block(CBigInt& d, CBigInt& n, int kbits, 
CBigInt& c, void *pDecBlock, int blockSize) 


1 


{ 
char *padBlock = new char[kbits / 8]; 
if(padBlock == NULL) 

return -1; 


CBigInt em = ModularPower(c, d, nN); 
int dataSize = em.PutToData(padBlock, kbits / 8); 


int pad len = 2; 
for(int i = 2; i < dataSize; i++) 
{ 
pad_ Jen++; 
if(padBlock[i] == 0) 
break; 
} 


memcpy(pDecBlock, padBlock + pad len, dataSize - pad len); 
delete[] padBlock; 


return dataSize - pad len; 
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18.4 RSA 签名 与 身份 验证 


RSA 密 钥 中 的 加 密 指数 e 和 解密 指数 4 是 关于 模 p(n) 的 乘法 逆 元 ， 这 个 关系 使 得 RSA 的 加 
密 和 解密 过 程 具有 一 个 很 有 意思 的 特点 。 这 个 特点 就 是 用 e 加 密 的 数据 可 以 用 4 解密 ， 反 过 来 ， 
用 4d 加密 的 数据 也 可 以 用 ee 解密。 利用 这 个 特点 ，RSA 算法 还 可 以 用 来 做 数字 签名 和 身份 验证 。 
数字 签名 是 只 有 信息 发 送 者 才能 产生 、 别 人 无 法 伪造 的 一 段 信息 , 这 段 信 息 还 可 以 用 来 验证 发 送 
者 所 发 送信 息 的 真实 性 。 可 以 这 样 理解 , 数字 签名 就 是 信息 发 送 者 用 自己 的 私 钥 对 一 段 公开 信息 
加 密 后 得 到 密 文 信息 ， 因 此 它 具 有 两 个 特征 : 


口 任何 人 都 可 以 利用 发 送 者 的 公 钥 验证 签名 的 有 效 性 〈 对 其 解密 并 比较 ) 
口 签名 具有 不 可 伪造 性 和 不 可 和 否认 性 〈 因 为 具有 发 送 考 有 与 公 钥 对 应 的 私 钥 ) 


签名 的 验证 就 是 利用 发 送 者 的 公 钥 对 加 密 信息 解密 ， 然 后 比较 解密 后 的 信息 是 和 否 是 原始 信 
息 。 数 字 签 名 的 一 般 过 程 是 : 用 户 A 用 选择 的 哈 希 算法 计算 出 文件 M 的 HASH 值 ， 然后 用 自己 
的 私 钥 对 这 个 HASH 值 进行 加 密 ， 这 个 过 程 就 是 “签名 ”。 现 在 A 把 文件 M (不 加 密 ) 和 加 密 后 
的 HASH 值 发 给 B，B 于 是 用 A 的 公 钥 对 HASH 值 解密 ， 然 后 再 计算 文件 M 的 HASH 值 ， 比 较 文 
件 的 HASH 值 是 否 和 A 发 来 的 HASH 值 一 样 ， 如 果 一 样 则 说 明文 件 确 实 是 A 发 来 的 ， 并 是 文件 没 
有 被 修改 。 否 则 就 说 明文 件 不 是 A 发 出 的 ,或 者 文件 在 传递 过 程 中 被 算 改 了 。 由 此 可 知 ， 数 字 签 
名 除了 证 明文 件 M 是 A 发 出 的 ， 还 可 以 验证 文件 M 是 否 被 其 他 人 包括 接受 者 ) 算 改 或 伪造 。 

身份 验证 的 过 程 和 签名 的 过 程 类 似 , 当 B 需要 验证 A 的 身份 时 , 就 将 一 段 信 息 发 给 A, 请 A 
对 其 进行 签名 ( 加 密 )。 得 到 A 的 签名 后 ，B 使 用 A 的 公 钥 对 签名 解密 ， 验 证 是 否 和 自己 发 给 A 
的 信息 一 致 ， 以 此 验证 A 身份 。 其 他 人 没有 A 的 私 钥 ， 无 法 伪造 A 的 签名 。 

和 RSA 的 加 密 一 样 ， 使 用 RSA 签名 一 样 需要 面 对 各 种 攻击 ， 因 此 ， 不 要 随便 对 某 一 个 人 发 
过 来 的 东西 进行 签名 ( 有 潜在 危险 )。 如 果 必 须要 这 么 做 ( 比如 为 了 验证 身份 )， 最 好 先 用 哈 希 算 
法 计算 出 信息 的 HASH 值 ， 然 后 对 HASH 值 进 行 签名 。 


18.4.1 RSASSA-PKCS 与 RSASSA-PSS 签名 填充 模式 


RSA 的 签名 和 身份 验证 过 程 ， 面临 着 和 RSA 加 密 过 程 一 样 的 攻击 方法 ,因此 RSA 实验 室 对 
签名 算法 也 制定 了 和 加 密 过 程 一 样 的 随机 填充 模式 标准 一 一 带 填充 的 签名 算法 。PKCS 制定 了 两 
种 带 填充 的 签名 算法 ,分 别 是 RSASSA-PSS 和 RSSSA-PKCS#1 1.5。 尽 管 从 理论 上 讲 RSASSA-PSS 
比 RSSSA-PKCS 要 1.5 有 更 好 的 健壮 性 ， 但 是 目前 还 没有 发 现 针对 RSSSA-PKCS #1 1.5 的 有 效 
的 攻击 手段 。RSSSA-PKCS #1 1.5 的 签名 算法 已 经 在 很 多 系统 上 得 到 了 广泛 的 应 用 ， 具 有 很 好 的 
兼容 性 ， 不 过 PKCS 标准 建议 新 的 应 用 系统 应 该 能 够 平滑 地 过 度 到 RSASSA-PSS 算法 。 


RSSSA-PKCS #1 1.5 签名 算法 的 填充 方式 和 PKCS #1 1.5 加 密 算法 的 填充 方式 类 似 ， 主 要 由 
以 下 六 部 分 组 成 : 
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EM = 0x00 | 0x01 | PS | 0x00 | TIH 

首先 是 前 导 0，7 标 识 固定 是 1， 也 就 是 说 ，PS 使 用 随机 长 度 的 0xFF 填充 ， 跟 在 截断 标识 0 
后 的 了 是 一 个 与 哈 希 算法 相关 的 字 节 串 , 其 内 容 与 哈 希 算法 有 关 , 但 是 每 种 哈 希 算法 对 应 的 了 的 
内 容 和 长 度 是 固定 的 。 哈 希 算法 与 7 的 关系 如 表 18-2 所 示 。 


表 18-2 PKCS #1 1.5 签 名 算法 中 险 希 算法 与 7 填充 内 容 的 关系 


1 


Hash T 
MD5 30 20 30 0c 06 08 2a 86 48 86 f7 0d 02 05 05 00 04 10 
SHA-1 30 21 30 09 06 05 2b 0e 03 02 1a 05 00 04 14 
SHA-224 30 2d 30 0d 06 09 60 86 48 01 65 03 04 02 04 05 00 04 1c 
SHA-256 30 31 30 0d 06 09 60 86 48 01 65 03 04 02 01 05 00 04 20 
SHA-384 30 41 30 0d 06 09 60 86 48 01 65 03 04 02 02 05 00 04 30 
SHA-512 30 51 30 0d 06 09 60 86 48 01 65 03 04 02 03 05 00 04 40 


五 是 明文 M 的 哈 希 值 ， 填 充 数据 PS 的 长 度 等 于 -|71-| 厂 -3， 其 中 是 RSA 密 钥 公 共 模 
数 n 的 字 节 长 度 , |7I 是 填充 7 的 长 度 , | 硬是 明文 M 的 哈 希 值 的 长 度 。 完 成 填充 后 得 到 EM, 将 其 
转换 成 大 整数 ， 用 私 钥 进行 加 密 ， 就 得 到 数字 签名 。 

RSSSA-PKCS #1 1.5 的 签名 验证 过 程 与 解密 过 程 类 似 ， 首 先 将 签名 数据 转换 成 大 整数 ， 然 后 
用 公 钥 解密 ， 就 得 到 签名 之 前 的 填充 状态 EM。 分 解 EM， 得 到 签名 中 的 原始 信息 的 哈 希 值 瓦 ， 
然后 将 这 个 万 与 原始 明文 计算 出 来 的 喻 希 值 比较 , 如 果 一 致 则 签名 验证 成 功 ， 如 果 不 一 致 , 说 明 
这 是 一 个 无 效 的 签名 ， 或 者 是 伪造 的 签名 。 


RSSSA-PSS 签名 填充 模式 是 一 种 新 的 签名 填充 ， 在 RSSSA-PKCS #1 v2.1 中 被 接受 为 PKCS 
的 标准 。RSSSA-PSS 源 于 Mihir Bellare 和 Philip rogaway 发 明 的 概率 填充 方案 ( Probabilistic 
Signature Scheme )， 将 其 应 用 于 RSA 加 密 体系 ， 就 是 RSSSA-PSS。RSSSA-PSS 签名 算法 的 输入 
参数 是 明文 M 和 签名 体 最 大 比特 长 度 emBits，emBits 的 最 小 值 不 能 小 于 8hLen+8sLen+9， 其 签 
名 过 程 如 下 。 

(1) 计算 明文 M 的 哈 希 值 mnHash=HASHCQAD， 长 度 为 hLen， 生 成 一 个 随机 字 节 串 salt， 长 度 
为 sLen; 

(2) 拼接 MP=0 0 000000|mHashlsalt， 计 算 MP 的 哈 希 值 5=HASH(MP), 五 长 度 是 hLen; 

(3) 生成 由 0 字 节 组 成 的 字 节 串 PS， 长度 为 emLen-hLen-sLen -2, emLen=|empBits /8|。PS 
的 长 度 也 可 以 是 0; 

(4) 令 DB = PSI0x01lsalt，DB 是 一 个 长 度 为 emLen - hLen -1 的 字 节 串 ; 

(5) 用 掩 码 生成 函数 将 MP 的 哈 希 值 五 转换 成 长 度 为 emLen - hLen - 1 的 掩 码 ，DBmask= 
MGF(H, emLen -hLen -1); 

(9 计算 mDB=DB@DBMask, 将 mDB 的 左边 最 高 有 效 位 的 gemLen-emBits 个 比特 置 为 0; 

(7) 拼接 mDB、MP 的 哈 希 值 石 以 及 一 个 字 节 的 固定 值 0xBC， 得 到 EM=mDBIHIO0xBC。 将 
EM 转换 成 大 整数 ， 用 私 钥 加 密 即 可 得 到 RSSSA-PSS 填充 的 数字 签名 。 


I 
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RSSSA-PSS 签名 的 验证 过 程 首先 要 将 签名 体 转换 成 大 整数 ,用 公 钥 解密 得 到 EM, 然后 按照 
以 下 步 又 验证 EM。 


(1) 从 左 到 右 对 EM 进行 分 解 ， 前 emLen-hLen-1 个 字 节 是 mDB， 接 下 来 是 hLen 字 节 的 瓦 ， 最 
右边 是 一 个 字 节 的 固定 值 0xBC， 如 果 最 右边 一 个 字 节 不 是 0xBC， 则 输出 “验证 失败 ”， 并 停止 ; 

(2) 如 果 mDB 左边 最 高 8emLen - emBits 个 比特 不 是 0， 则 输出 “验证 失败 ”， 并 停止 ; 

(3) 用 掩 码 生 成 函数 将 玉 转 化 成 emLen -hLen - 1 字 节 的 掩 码 DBmask= MGF(H, emLen - 
hLen - 1)， 并 计算 出 DB=mDB @DBMask; 

(4) 将 DB 的 左边 最 高 有 效 位 的 8emLen - emBits 个 比特 置 为 0， 并 判断 emLen - hLen - sLen 
- 工 位置 的 一 个 字 节 是 否 是 0x01， 如 果 不 满足 这 两 个 条 件 ， 则 输出 “验证 失败 ”"， 并 停止 ; 

(5) DB 的 最 后 sLen 个 字 节 是 salt， 计 算出 明文 M 的 哈 希 值 mHask， 并 拼接 出 MP=000000 
0 0 |mHashlsalt; 

(6) 计算 MP 的 哈 希 值 ， 并 与 五 比较 ， 如 果 相 等 则 输出 “验证 成 功 ”， 否 则 输出 “验证 失败 ”， 
并 停止 。 

由 此 可 见 ，RSSSA-PSS 和 其 他 签名 填充 模式 一 样 ， 也 是 遵循 “ 先 哈 希 再 签名 ”的 原则 ， 不 
直接 使 用 明文 M 签 名 。 


18.4.2 ”签名 算法 实现 


有 了 上 一 节 分 析 的 签名 算法 的 原理 和 实现 步骤 ， 写 出 签名 算法 的 实现 代码 就 易如反掌 。 
Rsa_Pkcs15_Sign() 函 数 就 是 RSSSA-PKCS 算法 的 实现 ， 采 用 了 MD5 作为 哈 希 值 计算 函数 ， 可 以 
看 到 其 填充 方式 和 PKCS 加 密 填 充 方式 类 似 ， 最 终 psignBuf 得 到 kbits (下 字 节 ) 的 签名 数据 : 

int Rsa Pkcs15 Sign(CBigInt& d，CBigInt& n, int kbits, 


void *pSrcData, int dataSize, void *pSignBuf, int bufSize) 


{ 
int k = kbits / 8; 


char *padBlock = new char[k]; 
if(padBlock == NULL) 
return -1; 


unsigned char md5Hash[MD5 DIGEST SIZE] = { 0 }; 
CalcMDsHash(pSrcData, dataSize, md5Hash); 


int pad len = k - MD5 DIGEST SIZE - Md5SignPadSize - 3; 

padBlock[0] = Ox00; 

padBlock[1] = 0x01; // 填 充 全 xFF 

GeneratepkcsPpad(1, padBlock + 2, pad len); 

padBlock[pad len + 2] = Ox00; 

memcpy(padBlock + pad len + 3, Md5SignPadding, Md5SignpadSize); 
memcpy(padBlock + pad len + 3 + Md5SignpadSize, md5Hash, MD5 DIGEST SIZE); 
CBigInt em; 

em.GetFromData(padBlock, k);//0S2IP 

CBigInt c = ModularPower(em, d, n); 
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c.PutToData( (char *)pSignBuf, kK); 


delete[] padBlock; 
return k; 


18.4.3 ”验证 签名 算法 实现 


RSSSA-PKCS 算法 的 签名 验证 实现 也 不 复杂 ， 出 于 篇 幅 考 虑 ，Rsa_Pkcs15_Verify() 函 数 给 出 

了 概念 性 实现 代码 ， 这 个 函数 只 处 理 了 具体 哈 希 值 的 解析 和 判断 ( 这 已 经 是 签名 验证 算法 的 主 

体 )， 没 有 对 填充 数据 的 格式 校 验 ， 有 兴趣 的 读者 可 自行 加 上 校 验 ， 使 之 成 为 更 有 实用 性 的 签名 
验证 算法 。 


bool Rsa Pkcs15 Verify(CBigInt& e, CBigInt& n, int kbits, 
void *pSignData, int dataSize, void *pSrcData, int srcSize) 
{ 


char *padBlock = new char[kbits / 8]; 
if(padBlock == NULL) 
return false; 


CBigInt c; 

c.GetFromData((const char *)pSignData, dataSize); 
CBigInt em = ModularPower(c, e, nN); 

int emSize = em.PutToData(padBlock, kbits / 8); 
int pad len = 2; 

for(int i = 2; i < emSize; i++) 


{ 


pad_ lent+t+; 
if(padBlock[i] == 0) 
break; 


} 


unsigned char mdsHash[MD5 DIGEST SIZE] = { 0 }; 
CalcMD5Hash(pSrcData, srcSize, md5Hash); 


int result = memcmp(padBlock + pad len + Md5SignpadSize, md5Hash, MD5_DIGEST SIZE); 
delete[] padBlock; 


return (result == 0); 


} 
18.5 总结 


这 一 章 我 们 介绍 了 RSA 算法 的 原理 ， 把 看 似 神秘 的 RSA 算法 在 放大 镜 下 看 了 个 底 朝 天 ， 原 
来 如 此 嘛 ， 你 应 该 有 这 种 感觉 吧 ? 蒙哥马利 算法 、 米 勒 - 拉 宾 算法 、 欧 几 里 得 算法 ， 一 个 个 看 似 
高 高 在 上 的 名 词 ， 原 来 有 如 此 平易 近 人 的 实现 ,举重 若 轻 ， 算 法 的 乐趣 尽 在 于 此 吧 。 现 在 ， 你 可 
以 用 本 章 的 算法 给 自己 弄 个 签名 什么 的 , 也 可 以 把 自己 的 公 钥 散发 出 去 , 让 别人 也 给 你 发 送 加 密 
邮件 ， 最 重要 的 ， 这 些 都 是 你 自己 实现 的 。 
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还 记得 介绍 广义 黎 曼 猜想 时 提 到 的 英国 数学 家 哈代 吗 ? 有 一 次 ， 哈 代 要 乘 船 渡 北 海 回 英 国 ， 


那天 天 气 恶劣 ， 浪 涛 漳 涌 ， 而 船 又 很 小 , 因此 他 在 船 开 之 前 就 写 了 一 张 明 信 片 寄 给 丹麦 物理 学 家 
波 尔 〈Harald Bohr )， 上 面 只 写 了 一 句 话 :“ 我 已 经 证 明了 黎 曼 猜想 。 哈 代 。” 哈代 寄 这 张 明 信 片 
的 用 意 是 : 万 一 这 船 沉 和 大海， 哈代 死 了 ,世人 就 会 认为 哈代 真 的 解决 了 这 个 世界 数学 难题 ， 而 
为 这 个 解法 及 哈代 一 起 沉 入 海底 而 忱 惜 。 但 是 上 帝 如 此 不 喜欢 哈代 , 一 定 不 会 让 哈代 享有 解决 这 
个 著名 难题 的 声誉 ,肯定 不 会 让 这 租 船 沉 和 大海， 于 是 哈代 就 可 以 平安 回 到 英国 ,这 样 这 张 明 信 
片 就 是 他 的 护身符 了 。 本 章 有 些 内 容 还 是 比较 严肃 的 , 大 家 看 看 这 个 乐 一 下 吧 ， 顺便 说 一 下 ,这 
不 是 笑话 ， 是 真 事 儿 。 
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第 1 0/ 章 
数 独 游戏 


数 独 游戏 ( SUDOKU ) 是 一 种 数学 智力 拼图 游戏 ， 起 源 于 18 世纪 末 的 瑞士 ， 当 时 的 瑞士 数 
学 家 莱 昂 哈 德 : 欧 勒 发 明了 “拉丁 方块 ”游戏 , 但 并 没有 受到 人 们 的 重视 。 直 到 20 世纪 70 年 代 ， 
美国 杂志 才 以 “数字 拼图 ”( number place puzzles ) 游戏 的 名 称 将 它 重 新 推出 ,结果 风靡 一 时 。 日 
本 随后 接受 并 推广 了 这 种 游戏 ， 并 量 将 它 改 名 为 “ 数 独 *”， 大 致 的 意思 是 “ 独 个 的 数字 ”或 “只 
出 现 一 次 的 数字 ”。 数 独 游戏 在 日 本 非常 流行 ， 许 多 报纸 条 志 都 会 刊登 数 独 游戏 。 在 日 本 的 地 
铁 上 经 常 看 到 手 拿 报纸 和 铅笔 、 眉头 紧 锁 的 人 ， 那 就 是 在 玩 数 独 游戏 。 玩 数 独 游戏 不 需要 学 习 额 
外 的 知识 ， 也 不 像 字谜 游戏 那样 需要 很 大 的 词汇 量 ， 大 人 和 小孩 都 适合 玩 数 独 游 戏 。 

数 独 游戏 在 流行 的 过 程 中 产生 了 很 多 变形 数 独 ， 比 如 格子 数 演 变 成 6x6，12 x 12， 甚 至 是 
16 x 16, 还 有 的 规则 要 求 对 角 线 上 的 数字 也 要 满足 不 重复 的 要 求 。 不 过 , 总 的 来 说 ， 这 些 变种 都 
没有 偏离 这 个 游戏 的 基本 规则 。 本 章 就 介绍 一 下 传统 的 9x9 格 子 的 数 独 游 戏 ( 九宫 数 独 )， 并 给 
出 一 种 以 候选 数 法 为 基础 的 求解 数 独 游戏 的 算法 实现 。 


19.1 数 独 游戏 的 规则 与 技巧 


数 独 游戏 有 着 独特 的 规则 和 技巧 ,在 数 独 游戏 的 推广 和 传播 过 程 中 , 出现 了 很 多 新 的 规则 和 
新 的 形式 。 本 节 将 简单 介绍 一 下 数 独 游 戏 的 基本 规则 ,也 是 被 最 广泛 接受 的 规则 ， 当 然 ， 也 包括 
在 此 规则 基础 上 的 一 些 常 用 技巧 。 


19.1.1 数 独 游戏 的 规则 


9x9 格 子 数 独 游戏 的 形式 如 图 19-1 所 示 ， 为 了 方便 描述 ， 一 般 用 大 写字 母 A ~I 来 标识 行 ， 
用 数字 1 ~ 9 来 标识 列 ， 这 样 每 个 小 单元 格 就 有 了 坐标 。 数 独 游戏 的 规则 非常 简单 ， 就 是 在 9x9 
= 81 个 单元 格 中 填 人 数字 1 ~9。 这 81 个 单元 格 又 组 成 3 x3 =9 个 小 九宫 格 ， 要 求 填 人 的 数字 在 
每 行 和 每 列 都 不 能 有 重复 , 同时 在 每 个 小 九宫 格 中 也 不 能 有 重复 。 游戏 开始 时 会 将 一 些 位 置 上 的 
数字 固定 下 来 ， 这 称 为 提示 数 〈 或 起 始 数 )， 根 据 提示 数 的 位 置 和 数量 可 以 将 数 独 游戏 分 成 不 同 
的 难度 级 别 。 
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图 19-1 一 个 数 独 游戏 的 例子 


19.1.2” 数 独 游戏 的 常用 技巧 


解决 数 独 问题 的 技巧 大 致 可 分 为 两 类 , 一 类 是 直观 法 , 男 一 类 是 候选 数 法 。 直 观 法 就 是 不 借 
助 任何 辅助 工具 , 直接 利用 数 独 游戏 的 规则 进行 求解 的 方法 , 一 般 只 需 一 只 铅笔 就 可 以 直接 在 报 
纸 或 杂志 上 玩 了 。 这 种 方法 适合 求解 简单 的 数 独 游 戏 ,， 对 于 常见 于 报纸 和 杂志 上 的 数 独 题目 〈 专 
业 数 独 杂志 除外 )， 都 可 以 轻松 应 对 ， 也 是 最 能 体验 数 独 乐趣 的 一 种 方法 。 直 观 法 常用 的 技巧 包 
括 唯 一 解法 、 基 础 排除 法 、 区 块 排除 法 、 唯 余 解 法 、 和 矩形 排除 法 、 单 元 排除 法 等 。 这 些 技巧 中 唯 
一 解法 、 基 础 排除 法 和 唯 余 解 法 是 基本 的 技巧 ， 一 般 简单 的 数 独 用 这 三 种 解答 技巧 就 可 以 应 付 。 
除 此 之 外 , 其 他 几 种 技巧 都 对 应 一 种 或 多 种 稍微 复杂 的 数 独 局 面 ， 当 求解 数 独 过 程 中 遇 到 与 之 相 
似 的 局 面 时 ， 应 用 对 应 的 方法 可 以 起 到 事半功倍 的 效果 。 


候选 数 法 首先 要 根据 数 独 题目 的 需要 为 每 个 没有 确定 的 单元 格 建立 一 个 候选 数列 表 , 然后 根 
据 各 种 排除 方法 , 逐步 排除 每 个 单元 格 中 不 可 能 出 现 的 候选 数 ， 当 某 个 单元 格 对 应 的 候选 数列 表 
中 只 剩 下 唯一 候选 数 时 , 这 个 剩 下 候选 数 就 是 该 单元 格 要 填 的 正确 数字 。 候 选 数 法 需要 一 个 准备 
过 程 ， 要 为 每 个 单元 格 建立 候选 数列 表 , 通常 在 解 题 过 程 中 ， 都 是 先 利用 直观 法 进行 求解 ， 直 到 
直观 法 无 法 继续 时 ,， 才 使 用 候选 数 法 。 候 选 数 法 需要 做 一 些 简单 的 记录 来 维护 候选 数列 表 ， 因 此 
没有 直观 法 那么 直接 , 但 是 候选 数 法 适合 解决 较为 复杂 的 数 独 难题 ( 比如 有 多 个 解 的 数 独 问 题 )。 
候选 数 法 常用 的 技巧 包括 唯一 候选 数 法 、 隐 性 唯一 候选 数 法 、 区 块 删 减法 、 数 对 删 减 法 、 隐 性 数 
对 删 减法 、 三 链 数 删 减法 、 隐 性 三 链 数 删 减法 、 抑 形 顶 点 删 减法 、 三 链 列 删 碱 法 、 关 键 数 删 减 法 、 
关连 数 删 减法 等 。 


19.2 ”计算 机 求解 数 独 问题 
用 计算 机 求解 数 独 问题 最 典型 的 方法 就 是 使 用 穷 举 的 方法 遍历 整个 解 空间 , 遍历 过 程 中 结合 


数 独 规则 设置 适当 的 “ 剪 校 ”条 件 排除 掉 一 些 明显 错误 的 分 文 ， 加 快 遍历 的 速度 。 这 种 方法 的 算 
法 实现 简单 , 对 于 9 x9 的 数 独 题目 来 说 , 解 题 的 速度 还 可 以 ; 对 于 有 多 个 解 的 高 难度 数 独 问题 ， 
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也 可 以 轻松 应 对 。 这 种 方法 的 问题 是 遍历 和 回溯 都 是 在 最 大 深度 上 进行 的 , 对 于 一 个 已 经 固定 了 
28 个 数字 的 数 独 题 目 来 说 ,遍历 和 回溯 的 深度 就 是 81-28=53 层 ， 效 率 很 低 。 另 外 ， 为 了 能 利用 
“前 校 ”加 快 遍历 速度 ， 在 遍历 过 程 中 要 频繁 地 判断 当前 数 独 状态 是 否 符 合 数 独 规则 ， 而 这 些 判 
断 在 很 多 情况 下 都 是 不 必要 的 。 

最 简单 的 穷 举 算法 是 对 每 个 单元 格 都 进行 深度 尝试 ， 也 就 是 用 1 ~ 9 分 别 进行 试 数 ， 然 后 利 
用 数 独 规则 对 试 数 进行 检查 , 如 果 合 法 则 继续 对 下 一 个 单元 格 试 数 , 直到 所 有 单元 格 都 填 了 数字 ， 
且 检 查 符合 数 独 规则 就 算 找 到 一 个 解 。 有 一 些 文献 或 资料 提出 了 一 种 改进 的 方法 , 就 是 仿照 候选 
数 法 为 每 个 单元 格 建立 候选 数列 表 , 穷 举 的 时 候 只 利用 候选 数列 表 中 的 数字 进行 试 数 。 这 种 改进 
减少 了 一 些 明显 不 正确 的 尝试 。 不仅 如 此 , 候选 数 一 般 是 该 单元 格 上 可 能 的 合法 数字 ， 直接 使 用 
候选 数 进行 试 数 可 以 避免 不 必要 的 有 效 性 检查 , 这 些 都 能 有 效 地 提高 算法 效率 。 但 是 这 种 方法 只 
是 机 械 地 利用 候选 数列 表 避 免 了 不 必要 的 尝试 , 并 没有 充分 利用 数 独 游戏 规则 对 每 个 单元 格 的 候 
选 数 列表 进行 动态 维护 ， 并 没有 最 大 限度 地 发 挥 候选 数列 表 的 作用 。 


本 章 要 介绍 的 算法 也 是 一 种 基于 候选 数 方法 的 穷 举 算法 , 但 是 本 方法 不 仅 利用 候选 数列 表 减 
少 不 必 要 的 试 数 次 数 , 还 在 每 次 试 数 的 过 程 中 动态 维护 相关 单元 格 的 候选 数列 表 。 动态 维护 候选 
数列 表 的 优点 是 不 仅 可 以 更 快 地 排除 候选 数 , 尽 可 能 多 地 减少 试 数 的 次 数 , 还 可 以 在 一 次 试 数 的 
过 程 中 确定 多 个 单元 格 的 数字 。 在 介绍 这 种 方法 之 前 ， 先 来 了 解 一 个 概念 : 相关 20 格 。 数 独 中 
每 一 个 单元 格 所 在 的 行 、 列 和 小 九宫 格 中 的 20 个 单元 格 被 称 为 这 个 单元 格 的 相关 20 格 。 在 数 独 
游戏 中 ， 在 一 个 单元 格 填 入 一 个 确定 数字 ， 则 这 个 单元 格 的 相关 20 格 都 会 受到 影响 。 对 于 候选 
数 法 来 说 ， 这 种 影响 就 是 候选 数 的 排除 。 实 际 上 ， 在 对 每 个 单元 格 试 数 的 过 程 中 ， 相 关 20 格 的 
候选 数列 表 是 会 发 生变 化 的 , 有 可 能 会 导致 某 些 单元 格 出 现 唯一 候选 数 , 还 可 以 利用 这 一 点 在 一 
次 试 数 过 程 中 确定 多 个 单元 格 的 数字 , 减少 回溯 的 次 数 。 另 外 , 在 试 数 的 过 程 中 , 各 个 单元 格 的 
候选 数列 表 是 动态 维护 的 ,也 就 是 说 这 些 候 选 数 都 是 可 以 填 人 单元 格 的 有 效 候选 数 , 因 此， 整个 
穷 举 过 程 都 不 需要 进行 数 独 规则 的 合法 性 检查 。 当 最 后 被 确定 的 单元 格 达到 81 个 时 ， 得 到 的 就 
是 一 个 合法 的 数 独 结 

现在 来 总 结 一 下 本 章 介 绍 的 算法 的 要 点 。 首 先 为 每 个 单元 格 建立 候选 数列 表 , 并 且 对 每 个 已 
经 给 出 的 提示 数 使 用 基本 排除 法 ， 排 除 与 这 些 提示 数 有 关 的 相关 20 格 的 无 效 候选 数 。 然 后 利用 
枚 举 的 方法 对 每 个 还 没有 确定 的 单元 格 进行 试 数 ， 每 进行 一 次 试 数 ， 就 对 这 个 单元 格 的 相关 20 
格 的 候选 数列 表 进 行 排除 法 维护 ， 如 果 相 关 20 格 中 的 某 个 单元 格 位 置 符合 唯一 候选 数 条 件 ， 则 
将 这 个 单元 格 设置 为 确定 状态 ， 同 时 对 这 个 单元 格 的 相关 20 格 的 候选 数 再 进行 排除 (这 个 过 程 
可 能 是 递归 过 程 )。 重复 上 述 过 程 ， 直 到 本 次 试 数 结束 。 当 最 后 一 个 未 确定 的 单元 格 完成 试 数 时 ， 
得 到 的 结果 就 是 正确 的 结果 ， 不 需要 再 做 数 独 规 则 合法 检查 。 

穷 举 算法 的 效率 主要 由 穷 举 所 需要 搜索 的 解 空 间 大 小 所 决定 , 需要 搜索 的 解 空间 越 大 , 找到 
正确 结果 的 效率 就 越 低 。 对 于 具体 的 实现 算法 来 说 , 穷 举 算法 每 次 深度 搜索 需要 回溯 的 次 数 直接 
决定 了 解 空 间 的 大 小 , 减少 回溯 次 数 就 能 有 效 地 减少 穷 举 需要 搜索 的 解 空 间 大 小 。 本 章 给 出 的 算 
法 从 理论 上 将 可 以 有 效 地 减少 穷 举 回溯 的 次 数 , 实际 效果 如 何 呢 ? 接 下 来 就 给 出 算法 实现 , 就 递 


汀 
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归 回 渊 的 深度 进行 一 下 验证 。 


19.2.1 建立 问题 的 数学 模型 


本 书 前 面 介绍 过 , 用 计算 机 求解 现实 问题 ， 需 要 解决 三 个 关键 问题 : 计算 机 求解 数学 模型 的 
建立 、 人 类 语言 描述 的 问题 与 数学 模型 的 转换 和 算法 设计 。 对 于 数 独 游戏 这 样 简 单 的 问题 ， 建 立 
数学 模型 可 以 简化 为 一 系列 简单 数据 结构 的 定义 。 这 些 数据 结构 不 仅 要 能 在 计算 机 系统 内 表达 原 

台 问 题 , 还 要 有 利于 设计 算法 。 算法 设计 可 以 理解 为 对 表达 在 定义 好 的 数据 结构 上 的 数据 的 一 系 
列 操作 和 转换 ， 因 此 ， 数 据 结构 的 定义 还 要 能 够 对 这 些 操作 和 转换 提供 尽 可 能 的 便利 。 

首先 , 我 们 需要 一 个 模型 表达 数 独 游戏 的 每 个 小 单元 格 。 根 据 对 题目 的 理解 ， 每 个 小 单元 格 
可 能 有 两 种 状态 , 分 别 是 确定 数字 的 状态 和 不 确定 数字 的 状态 。 当 单元 格 处 于 确定 的 状态 时 , 需 
要 一 个 属性 描述 这 个 确定 的 数字 。 当 单元 格 处 于 不 确定 的 状态 时 ,需要 一 个 属性 描述 候选 数列 表 。 
在 定义 数据 结构 时 , 我 们 当然 可 以 为 单元 格 定义 两 种 数据 结构 , 但 是 考虑 到 在 数 独 问题 的 求解 过 
程 中 ， 单 元 格 的 状态 会 发 生变 化 ， 为 了 使 数据 的 表达 形式 统一 ， 便 于 数 独 整 体 数据 结构 的 定义 ， 
我 们 考虑 将 单元 格 的 数据 结构 统一 定义 如 下 : 


typedef struct 
{ 


int num; 

bool fixed; 

std::set<int> candidators; 
}SUDOKU CELL; 


其 中 额外 附加 的 fixed 标志 用 于 标识 单元 格 的 两 种 状态 。 候 选 函 数列 表 使 用 了 STL 的 set 容 
带 ， 因 为 在 算法 实现 过 程 中 ， 对 候选 数列 表 最 常见 的 操作 就 是 删除 某 个 候选 数 ，STL 的 set 容器 
无 疑 为 这 个 操作 提供 了 最 方便 的 接口 。 

接 下 来 考虑 一 下 数 独 整体 数据 结构 的 定义 。 因为 我 们 的 算法 不 需要 复杂 的 规则 检查 ,因此 不 
需要 额外 的 标识 ， 只 需要 一 个 二 维 矩 阵 表示 81 个 单元 格 ， 另 外 再 加 上 一 个 当前 已 经 确定 的 单元 
格 计数 器 即 可 : 

typedef struct 


SUDOKU CELL cells[SKD ROW LIMIT][SKD COL LIMIT]; 
int fixedCount; 
}SUDOKU GAME; 


在 算法 穷 举 解 空 间 的 过 程 中 ， 每 确定 一 个 单元 格 的 数字 ，fixedCount 计数 器 就 +1 ， 当 
fixedCount 计算 器 等 于 81 时 ， 就 表示 找到 了 一 个 合法 的 解 。 

从 数据 结构 定义 就 可 以 看 出 来 本 算法 的 数学 模型 相当 简单 , 但 是 简单 并 不 意味 着 粗糙 , 应 用 
这 个 模型 ， 将 原始 数据 转换 成 这 个 模型 以 及 输出 最 终 的 结果 都 变 得 非常 简单 。 
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19.2.2 ”算法 实现 


算法 实现 的 基本 思想 是 从 第 一 个 单元 格 开始 搜索 , 跳 过 已 经 确定 的 单元 格 , 直到 找到 一 个 未 
确定 的 单元 格 , 然后 使 用 这 个 单元 格 的 候选 数列 表 对 这 个 单元 格 开 始 试 数 。 每 试 一 个 数 , 就 将 相 
关 20 格 的 候选 数 进行 一 次 排除 ， 如 果 没 有 冲突 ， 就 从 这 个 单元 格 之 后 的 一 个 位 置 开始 继续 搜索 
未 确定 的 单元 格 ， 算 法 整体 结构 如 下 所 示 : 


void FindSudokuSolution(SUDOKU GAME *game, int sp) 


if(game->fixedCount == SKD CELL COUNT) 


{ 
std::cout «< "Find result :" <x std::endl; 
PrintSudokuGame (game); 
return; 

} 


sp = SkipFixedCell(game，sp); // 跳 过 确定 单元 格 
if(sp >= SKD CELL COUNT) 
return; 


int row = sp / SKD COL_LIMIT; 

int col = sp % SKD COL LIMIT; 

SUDOKU CELL *curCell = &game->cells[row][col]; 

SUDOKU GAME new state; 

std::set<int>::iterator it = curCell->candidators.begin(); 
while(it != curCell->candidators.end()) 


CopyGameState(game, &new state); 
if(SetCandidatorTofixed(&new state, row, col, *it)) 


{ 


// 试 数 成 功 ， 没 有 冲突 ， 从 后 面 一 个 单元 格 继续 
FindSudokuSolution(&new state, sp + 1); 


} 
++it; 
} 
} 


之 所 以 要 复制 一 个 新 状态 ， 是 因为 试 数 过 程 会 改变 某 些 单元 格 的 状态 ( 候选 数列 表 )， 为 了 
使 深度 遍历 能 够 正确 回溯 ,需要 保持 原状 态 不 变 。 因 此 ,复制 一 个 新 状态 ， 并 对 新 状态 进行 变换 
是 最 简单 的 方法 。 本 算法 如 果 还 有 提升 效率 的 余地 的 话 , 这 个 状态 的 处 理应 该 是 一 个 可 以 改进 的 
地 方 。 

SetCandidatorTofixed() 函 数 的 处 理 是 本 算法 区 别 于 其 他 算法 的 核心 。 对 相关 20 格 的 处 理 就 在 
这 个 函数 中 : 

bool SetCandidatorTofixed(SUDOKU GAME *game, int row, int col, int num) 


SwitchCellToFixed(game, row, col, Num); 


if(!ExclusiveCorrelativeCandidators(game, row, col, num)) 
return false; 
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if(!ProcessSinglesCandidature(game, row, col, num)) 
return false; 


// 到 这 里 说 明 在 [row][col] 位 置 填 入 num 没 有 问题 ， 可 以 确定 这 个 单元 格 的 数字 
game->fixedCount++; 
return true; 


} 
SwitchCellToFixed() 函数 将 当前 单元 格 的 状态 从 未 确定 转换 成 确定 ，ExclusiveCorrelative 
Candidators() 函 数 按照 数 独 规则 从 相关 20 格 的 候选 数列 表 中 删除 num。 如 果 此 次 试 数 num 选择 不 
合法 ,会 导致 相关 20 格 的 候选 数列 表 出 现 空 列表 的 情况 ， 如 果 出 现 这 种 情况 ， 
ExclusiveCorrelativeCandidators() 了 水 数 返回 false 终止 试 数 。ProcessSsinglesCandidature() 函 数 对 
排除 候选 数 后 的 相关 20 格 的 候选 数列 表 进 行 检查 ， 看 看 是 否 有 唯一 候选 数 的 情况 ， 如 果 某 个 单 
元 格 符合 唯一 候选 数 条 件 ， 则 将 此 单元 格 设置 为 确定 状态 ， 同 时 对 这 个 单元 格 的 相关 20 格 再 进 
行 排除 候选 数 操作 。ProcesssinglesCandidature() 函 数 分 别 对 [row][col] 位 置 所 在 的 行 、 列 和 小 九 
宫 格 进行 唯一 候选 数 检查 ， 以 行 检查 的 代码 为 例 : 
// 处 理 行 


for(int i = 0; i < SKD COL LIMIT; i++) 
{ 


if(!game->cells[row][i].fixed 
&& (game->cells[row][i].candidators.size() == 1)) 

{ 
int num = *(game->cells[row][il].candidators.begin()); 
if(!SetCandidatorTofixed(game, row, i, num)) 

return false; 
} 
} 


读者 可 能 已 经 注意 到 了 ， 这 是 个 递归 操作 ,也 就 是 说 ，SetCandidatorTofixed() 函 数 如 果 返 回 
false， 将 导致 递归 回溯 到 最 初 的 试 数 单元 格 位 置 ， 此 时 Findsudokusolution() 函 数 的 while 循环 
内 会 继续 尝试 下 一 个 候选 数 , 这 正 是 我 们 想 要 的 结果 。pProcessSinglesCandidature() 函 数 中 对 列 和 
小 九宫 格 的 处 理 与 行 处 理 方 法 类 似 ， 都 隐 式 地 包含 递归 过 程 。 


19.2.3 与 传统 穷 举 方法 的 结果 对 比 


如 果 用 最 简单 的 穷 举 方法 ， 对 于 有 26 个 提示 数 的 数 独 游 戏 ， 穷 举 需要 搜索 的 递归 深度 是 
81-26=55 级 。 我 用 1000 个 有 26 个 提示 数 的 数 独 游 戏 进 行 了 对 比 测试 ， 采 用 本 章 给 出 的 算法 ， 
穷 举 需要 搜索 的 递归 深度 平均 在 9 级 以 内 ， 最 多 不 超过 13 级 递归 搜索 。 其 中 30% 左 右 的 数 独 游 
戏 基本 上 在 2 ~ 3 级 深度 搜索 即 可 找到 正确 结果 。 对 于 芬兰 数学 家 因 卡 拉 给 出 的 号 称 世 界 最 难 的 
数 独 游戏 ， 本 算法 的 递归 深度 也 只 有 16 级 。 


19.3 ”关于 数 独 的 趣味 话题 


芬兰 都 柏林 大 学 学 院 的 Gary McGuire 曾经 公开 了 一 个 证 明 方 法 ,证 明了 一 个 数 独 具 有 唯 
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解 的 条 件 是 提示 数 不 能 少 于 17 个 。 也 就 是 说 , 16 个 或 更 少 提 示 数 的 数 独 游戏 可 能 会 存在 多 个 解 。 
无 独 有 偶 , 来 自 澳大利亚 自 佩 斯 市 西 澳 大 利 亚 大 学 的 数学 家 Gordon Royle 也 用 男 一 种 方法 证 明了 
数 独 具有 唯一 解 的 条 件 , 结论 也 是 17 个 提示 数 是 最 低 要 求 。 目 前 , 数学 家 们 普遍 认可 了 McGuire 
的 证 明 方 法 ,认为 其 证 明 方法 是 合理 的 , 但 是 同时 也 承认 ， 确 认 这 一 结论 还 需要 一 段 时 间 ， 以 便 
人 们 进行 足够 的 计算 进一步 证 明 其 正确 性 。 


19.3.1 数 独 游戏 有 多 人 少 终 盘 


除了 提示 数 与 唯一 解 的 关系 ， 关 于 数 独 有 多 少 终 盘 的 问题 , 也 是 一 个 很 有 趣 的 话题 。 很 多 人 
尝试 用 穷 举 的 方法 找 出 所 有 数 独 终 盘 ， 但 是 大 家 显然 都 低估 了 这 个 问题 。 首 先 来 看 一 下 解 空间 ， 
在 不 考虑 规则 的 情况 下 ，81 格 单元 格 填 数字 有 91 次 方 种 结果 ， 即 使 有 计算 机 能 进行 每 秒 一 千 亿 
次 穷 举 , 也 需要 62350028689609625069151416960588570612348887285709908335653 年 才能 穷 举 
出 所 有 解 《有 兴趣 的 读者 可 以 用 第 17 章 介绍 的 大 数 类 cBigInt 计算 一 下 )， 也 就 是 说 ， 到 那 时 候 
才能 知道 到 底 有 多 少 个 合法 的 数 独 终 盘 。 于 是 ， 这 个 问题 就 变 得 很 无 趣 了 。 

但 是 最 近 ， 这 个 问题 又 变 得 有 趣 了 。 首 先是 2005 年 ，Bertram Felgenhauer 和 Frazer Jarvis 两 
个 人 发 表 了 一 篇 名 为 “Enumerating possible Sudoku grids” 的 文章 ， 文 章 中 介绍 了 一 套 方法 ， 通 
过 小 范围 的 穷 举 加 上 数 独 单元 格 的 对 称 性 ， 计 算出 一 共有 6670903752021072936960 种 合法 的 数 
独 终 盘 。 有 兴趣 的 读者 可 参考 本 章 参考 资料 外 中 给 出 的 链接 ， 该 网 页 有 证 明 的 方法 和 相关 代码 。 
不 过 没 过 多 久 , 有 人 就 发 现 其 实 有 个 网 名 为 ‘QSCGZ” 的 家 伙 在 早 2003 年 就 在 谷歌 的 “rec.puzzles” 
群 中 发 布 了 这 个 结果 , 答案 是 一 样 的 , 但 是 没有 给 出 计算 方法 和 推算 原理 。 对 此 有 兴趣 的 读者 可 
以 通过 本 章 参 考 资料 中 中 的 链接 查 到 这 篇 帖子 。 

www.sudoku.com 网 站 对 这 个 问题 也 有 很 多 讨论 , 大 家 还 是 比较 认可 6670903752021072936960 
这 个 答案 的 。 实 际 上 ， 如 果 排 除 对 称 性 和 数字 换 位 等 重复 因素 ， 数 独 终 盘 一 共有 3546146300288 
种 。 知 道 了 数 独 终 盘 的 个 数 ， 那 么 这 么 多 终 盘 最 终 又 能 产生 多 少数 独 题目 呢 ? 我 们 不 妨 来 计算 一 
下 ， 每 个 数 独 有 81 个 单元 格 , 假设 每 次 挖 掉 n 个 数字 形成 一 个 数 独 题目 ,根据 排列 组 合理 论 , 一 
共有 Cs 种 挖 法 。 为 了 保证 数 独 有 了 唯一 解 ， 至 少 要 保留 17 个 提示 数 ， 也 就 是 说 n 最 多 只 能 是 
81-17=64。 如 果 每 次 只 控 掉 一 两 个 数 ， 肯 定 会 被 认为 是 侮辱 大 家 的 智商 ， 因 此 n 的 最 小 值 也 必须 
是 一 个 合理 的 数字 。 本 人 觉得 每 行 或 每 列 至 少 要 挖 掉 两 个 格子 的 题目 才 值 得 动 动脑 子 ( 尽管 这 仍 
然 是 非常 简单 的 题目 )， 因 此 设计 n 最 小 值 是 18。 这 样 一 来 ， 每 个 终 盘 能 设计 出 的 数 独 题目 就 是 
Yc 个 。 这 只 是 一 个 终 盘 的 结果 ， 考 虑 到 终 盘 的 个 数 ， 最 终 能 产生 的 数 独 游戏 是 个 天 文 数字 。 


1=18 


数 独 的 终 盘 有 如 此 之 多 ， 以 至 于 就 算 分 给 全 世界 60 亿 人 解决 ， 每 个 人 都 可 以 分 得 一 万 亿 个 
数 独 终 盘 。 数 独 爱好 者 们 可 能 会 很 泄气 ,一 辈子 玩 过 的 数 独 也 只 是 整个 游戏 的 皮毛 而 已 , 但 这 也 
正 是 数 独 游 戏 的 乐趣 所 在 , 不 用 担心 你 曾经 做 过 的 数 独 再 次 耽误 你 的 时 间 , 因为 你 在 有 生 之 年 碰 
上 两 个 相同 的 数 独 游戏 的 概率 太 小 了 ， 你 面 对 的 每 一 个 数 独 都 是 你 以 前 没有 见 过 的 。 
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19.3.2 ”史上 最 难 的 数 独 游戏 


2013 年 5 月 ， 网 络 上 的 各 种 媒体 都 在 炒作 一 则 新 闻 : 69 岁 中 国 农民 三 天 破解 世界 最 难 数 独 
游戏 。 我 曾经 关注 过 这 个 问题 ,新 闻 中 提 到 的 世界 最 难 数 独 游戏 据说 是 芬兰 数学 家 因 卡 拉 (Arto 
Inkala ) 花 了 三 个 月 的 时 间 设 计 的 一 个 数 独 局 ， 号 称 难度 系数 达到 11， 是 世界 上 最 难 的 数 独 局 。 
评价 一 个 数 独 游戏 的 难度 没有 量化 标准 , 采用 不 同 的 评价 标准 得 到 的 评价 结果 也 不 一 样 。 目 前 有 
很 多 评价 数 独 游戏 难度 的 软件 ， 比 较 有 名 的 是 Nicolas Juillerat 开发 的 Sudoku Explainer 和 
Bernhard Hobiger 开发 的 Hodoku。 一般 人 能 够 解 出 的 数 独 游戏 难度 都 在 1 ~5 级, Sudoku Explainer 
给 因 卡 拉 设 计 的 这 个 数 独 的 难度 评价 是 10.7。 

因 卡 拉 的 这 个 数据 题目 如 图 19-2 所 示 。 


aa-w /AN 


图 19-2 因 卡 拉 设 计 的 “世界 最 难 ” 数 独 19-3 ”媒体 刊登 的 解 题 手稿 


这 个 题目 确实 是 有 一 定 的 难度 ,用 本 文 给 出 的 算法 进行 求解 ， 回 淹 深 度 达到 了 16。 回 到 刚才 的 
新 闻 话 题 ， 有 多 事 的 媒体 后 来 公开 了 这 位 老 先 生 解 这 个 题目 时 的 手稿 ， 不 过 有 细心 的 网 友 发 现 ， 
他 其 实 是 改动 了 一 个 数字 才 得 到 了 结果 。 如 图 19-3 所 示 ， 他 将 D2 单元 格 的 5 改 成 了 8， 于 是 得 
到 了 一 个 答案 。 看 似 微小 的 改动 , 却 大 大 降低 了 这 个 题目 的 难度 。 改 动 之 后 ,题目 由 唯一 解 变 成 
了 多 解 〈 用 本 章 的 算法 求解 ， 得 到 295 个 解 )。 


后 来 , 包括 大 学 教授 在 内 的 众多 数 独 爱好 者 都 给 出 了 正确 答案 , 但 是 都 很 难 分 辨 出 是 自己 做 
的 还 是 计算 机 做 的 。 


19.4 ”总 结 


本 章 介 绍 了 一 种 非常 流行 的 数字 游戏 一 一 数 独 ， 并 且 给 出 了 一 种 结合 候选 数列 表 和 相关 20 
格 深度 搜索 技术 的 数 独 求解 算法 。 应 用 本 算法 可 以 有 效 地 减少 穷 举 过 程 中 的 搜索 深度 和 试 数 次 
数 ， 是 一 种 比较 高 效率 的 算法 。 当 然 , 本 章 还 讨论 了 数 独 终局 个 数 和 最 难 数 独 游戏 这 样 的 八卦 话 
题 ， 和 希望 读者 们 从 数 独 游戏 自动 求解 算法 中 体会 到 更 多 的 乐趣 。 
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华容 道 游戏 


/ 


华容 道 游 戏 具 有 开局 变化 多 端 、 百 玩 不 大 的 特点 , 与 七 巧 板 和 九 连环 一 起 被 数学 界 称 为 “中 
国 古 典 智力 游戏 三 绝 ””。 一 般 人 们 说 华容 道 游戏 的 最 快 解法 是 81 步 , 事实 上 这 样 说 是 不 准确 的 。 
传统 的 华容 道 游 戏 有 很 多 种 开局 ， 比 如 “ 横 刀 立马 ”“ 齐 头 并 进 *“ 兵 分 三 路 ”等 ,目前 已 知 “ 横 
刀 立 马 ” 开 局 的 最 快 解法 是 81 步 。 事 实 上 ,“ 齐 头 并 进 ” 开 局 的 最 快 解法 是 60 步 ， 而 号 称 最 难 
开局 的 “峰回路转 ”的 最 快 解法 是 138 步 。 

二 十 世纪 六 七 十 年 代 ， 中 日 学 者 经 过 努力 将 “ 横 刀 立马 ”开局 的 解法 提高 到 82 步 , 从 87 步 
到 82 步 用 了 几 十 年 的 时 间 。 但 是 很 快 就 有 美国 人 提出 了 81 步 解 法 , 并 说 这 是 理论 上 最 快 的 解法 
了 。 正当 大 家 惊 呼 不 解 的 时 候 , 谈 团 解 开 了 ， 原 来 美国 人 用 计算 机 搞定 了 这 个 问题 。 外 行 可 能 觉 
得 计算 机 太 神 奇 了 ,但 是 我 们 程序 员 应 该 知道 ,这 就 是 个 算法 设计 的 问题 。 迄 今 为 止 , 华容 道 问 
题 还 没有 找到 任何 数学 理论 支持 ， 自 然 也 没有 数学 解决 方法 ， 目 前 的 求解 算法 基本 上 都 是 穷 举 。 
再 次 提醒 ， 不 要 小 看 穷 举 算法 ， 目 前 还 只 能 靠 它 了 。 本 章 我 们 就 来 介绍 华容 道 游戏 的 解 题 算 法 。 
说 实话 ， 自 从 有 了 计算 机 算法 解决 华容 道 游 戏 , 人们 争 相 研究 最 快 解法 的 意义 就 消失 了 , 但 是 这 
个 游戏 本 身 还 是 值得 一 玩 的 。 


20.1 ”华容 道 游戏 介绍 


华容 道 游戏 的 名 字 据 说 来 源 于 著名 的 三 国 故 事 “ 诸 万 亮 知 算 华容 ， 关 云 长 义 释 曹 操 ”"。 根 据 
小 说 《三 国 演义 》 描 述 ， 曹 操 在 赤壁 大 战 中 被 刘备 和 和 孙权 的 “ 苗 肉 计 ”“ 火 烧 连 营 ” 打 败 ， 被 迫 
由 乌 林 向 华容 县 撤退 , 在 地 势 险 要 的 华容 道 与 关羽 相遇 。 曹 操 当 时 败退 得 十 分 狼 狐 ， 已 经 无 力 与 
关羽 一 战 ， 只 得 哀求 关羽 放行 。 关 羽 念 当 年 萌 操 的 旧 日 恩情 ， 义 释 草 操 ， 使 其 安全 回 到 江陵 。 华 
容 道 游戏 的 内 上 容 正 是 取 自 这 一 典故 。 华 容 道 游 戏 虽 然 有 个 很 中 国 化 的 名 字 , 但 是 它 的 发 明 者 并 不 
是 中 国人 。 美 国人 Lewis W. Hardy 在 1909 年 就 申请 了 名 为 “Pennant Puzzle” 的 美国 专利 ， 被 称 


事实 上 ， 华 容 道 游 戏 虽然 披 着 中 国文 化 的 外 衣 ， 但 却 是 个 地 地 道道 的 舶 来 品 。 这 种 滑 块 游戏 的 首创 是 美国 人 , 在 


中 国 的 本 土 化 过 程 中 添加 了 三 国 元 素 。 
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为 华容 道 游 戏 的 前 身 。 流 行 于 中 国 的 华容 道 游戏 是 英国 人 John Harold Fleming 在 1932 年 发 明 的 
(申请 了 英国 专利 )， 在 中 国 流行 以 后 加 入 了 三 国 背 景 ,成 为 一 款 具有 中 国 特色 的 游戏 。 


华容 道 游戏 在 一 个 5x4 的 棋盘 上 布置 多 名 蜀 国 大 将 和 军士 作为 棋子 , 将 曹操 围困 在 中 间 , 通 
过 滑动 各 个 棋子 ， 帮 助 曹操 移动 到 出 口 位 置 逃 走 。 图 20-1 就 是 华容 道 游戏 棋盘 的 一 个 展示 ,使 
用 了 经 典 的 “ 横 刀 立马 ” 开局 。 华 容 道 游戏 的 开局 有 很 多 种 ， SB 
用 最 少 的 滑动 步 又 将 曹操 走出 是 人 们 玩 这 个 游戏 的 乐趣 所 
在 。 以 经 典 的 “ 横 刀 立马 ”开局 为 例 ， 六 十 多 年 前 日 本 人 研 
究 出 的 最 快走 法 是 82 步 , 后 来 美国 人 用 计算 机 穷 举 得 到 了 最 
快 的 走 法 ,只 需 81 步 。 传 统 的 华容 道 开局 布局 并 不 多 , 但 是 
使 用 计算 机 技术 以 后 ， 更 多 的 有 解法 的 开局 被 穷 举 出 来 ， 除 
了 传统 的 “五 将 四 兵 一 横 ” 布 局 ,还 出 现 了 “五 将 四 兵 二 横 ” 
“七 将 四 横 三 竖 (无 兵 以 及 “七 将 三 横 四 竖 (无 兵 等 多 
种 布局 方式 ， 解 法 也 趋 于 多 样 化 。 关 于 华容 道 游戏 的 数学 原 
理 至 今 仍然 是 个 迷 ，20 个 格子 的 棋子 游戏 竟然 有 如 此 多 的 名 
堂 ， 也 正 因为 如 此 ， 华 容 道 游戏 与 魔方 、 独 立 钻石 棋 一 起 被 上 村 
数学 界 称 为 三 个 最 不 可 思议 的 智力 游戏 。 图 20-1 典型 的 华容 道 游戏 棋盘 展示 


20.2 ”自动 求解 的 算法 原理 


目前 研究 华容 道 游 戏 相关 的 算法 ， 主 要 关注 “有 和 多少 种 开局 “判断 一 个 局 面 是 否 有 解 ” 
和 “ 求 出 最 优 解 ”三 个 问题 。 由 于 华容 道 游戏 的 数学 原理 仍然 没有 被 研究 清楚 ， 因 此 还 没有 数 
学 的 方法 可 以 解决 华容 道 游戏 的 求解 问题 。 现 在 人 们 用 计算 机 求解 华容 道 问题 ， 基 本 上 都 是 建 
立 在 穷 举 法 基础 上 的 各 种 算法 。 用 某 种 精心 设计 的 算法 穷 举 搜索 所 有 可 能 的 解 ， 然 后 找 出 滑动 
步骤 最 少 的 解 作 为 最 优 解 ， 所 以 “判断 一 个 局 面 是 否 有 解 ” 实 际 上 和 “ 求 出 最 优 解 ”是 联系 在 
一 起 的 。 

使 用 穷 举 法 的 关键 是 要 弄 清 楚 穷 举 的 对 象 是 什么 。 在 第 5 章 和 第 6 章 都 介绍 了 穷 举 法 ,首先 
根据 问题 描述 抽象 出 一 个 状态 ， 将 问题 描述 演变 成 对 状态 的 穷 举 。 本 章 要 介绍 的 算法 也 不 例外 ， 
也 需要 将 问题 抽象 出 一 个 便于 计算 机 处 理 的 可 比较 、 可 存储 、 可 转化 为 结果 的 东西 。 因 为 这 是 一 
个 棋盘 类 游戏 , 我 们 将 其 称 为 “局 面 "。 简单 地 讲 , 图 20-1 就 是 一 个 局 面 , 它 是 一 个 特殊 的 局 面 ， 
也 就 是 开局 。 我 们 要 做 的 就 是 将 这 样 的 局 面 转 化 成 数学 模型 ,也 就 是 计算 机 能 够 理解 的 一 系列 数 
据 结 构 。 如 果 不 能 定义 局 面 , 穷 举 就 变 得 无 的 放 矢 ， 如 果 局 面 的 数学 模型 设计 得 不 好 ,会 给 算法 
设计 带 来 很 大 的 麻烦 。 


20.2.1 定义 棋盘 的 局 面 
棋 类 游戏 的 局 面 一 般 至 少 包含 两 部 分 内 容 , 分 别 是 棋盘 的 状态 和 棋子 的 状态 。 对 于 华容 道 游 
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戏 而 言 ， 可 以 将 5x4 的 格子 定义 为 棋盘 , 将 武将 定义 为 棋子 , 这 样 华容 道 游戏 的 局 面 就 可 以 仿照 


棋 类 游戏 的 局 面 进行 定义 。 先 来 看 看 棋盘 的 定义 ,棋盘 上 有 Sx4 个 格子 ， 每 个 格子 地 位 相等 ， 没 


有 特殊 的 格子 。 每 个 格子 有 两 个 状态 ， 即 被 某 个 棋子 (武将 ) 或 棋子 的 一 部 分 占用 的 状态 和 未 被 
ee 状态 。 一般 可 采用 二 维 数组 描述 棋盘 ,数组 元 素 的 值 用 1 和 0 分 别 表示 被 占用 


状态 和 空 状态 ,为 了 使 每 个 数组 元 素 能 够 表示 更 多 的 信息 ， 


本 


时 简化 移动 棋子 的 合法 性 判断 算法 ， 


0 首先 是 扩充 棋盘 数组 元 素 值 的 范围 ,如 果 每 个 数组 元 素 
的 值 是 0， 则 表示 对 应 的 格子 是 空 ， 如 果 数 组 元 素 的 值 是 非 0 的 值 ， 则 表示 是 哪 位 武将 占用 了 这 


个 位 置 ， 其 值 就 是 武将 对 应 的 编号 。 其 次 是 给 棋盘 定义 增加 一 个 “边界 ”"。 所 谓 的 边界 就 是 将 棋 


盘 扩 大 为 7x6， 棋 子 布局 仍然 使 用 中 间 的 5x4 个 格子 ， 四 周围 绕 的 格子 被 虐 巴 一 个 特殊 的 值 ， 作 
为 边界 类 型 的 格子 。 中 间 5x4 个 格子 的 值 要 么 是 0， 要么 是 某 个 武将 的 编号 。 我 们 用 从 1 开始 索 
引 值 为 每 个 武将 编号 ， 华 容 道 的 棋盘 上 能 放置 的 武将 个 数 最 多 不 会 超过 14 个 ， 所 以 我 们 用 15 
(COxOF ) 作为 边界 格子 的 值 。 增 加 的 这 些 边界 格子 其 实 就 是 设计 计算 机 算法 时 常用 的 “哨兵 位 ” 
( Guard Bit )， 哨 兵 位 在 算法 中 的 意义 就 是 表示 这 些 位 置 已 经 被 一 个 特殊 的 武将 棋子 占据 了 , 其 他 
武将 棋子 不 能 移动 到 这 里 。 这 是 一 种 常见 的 算法 设计 技巧 , 可 以 避免 数据 访问 过 程 中 为 防止 越界 
而 进行 的 边界 保护 判断 , 使 得 算法 能 够 对 移动 武将 的 操作 进行 一 致 性 处 理 。 以 本 章 介绍 的 算法 为 


例 ， 如 果 不 采用 哨兵 位 ， 每 次 判断 一 个 棋子 向 各 个 方向 滑 
动 的 合法 性 时 ， 除 了 判断 要 移动 的 方向 是 否 是 空 的 格子 之 
外 ， 还 要 针对 四 个 方向 分 别 做 边界 判断 。 而 使 用 了 四 周边 
界 的 哨兵 位 后 ， 只 需 根据 滑动 方向 修正 位 置 ， 然 后 判断 新 
位 置 是 否 为 空位 置 即 可 ， 因 为 边界 格子 的 值 和 其 他 已 经 被 
棋子 占用 的 格子 的 值 都 是 非 0 值 。 图 20-2 展示 了 采用 这 个 
棋盘 设计 方案 的 “ 横 刀 立马 ”开局 的 棋盘 状态 。 
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20-2 “ 横 刀 立马 ”开局 的 棋盘 状态 


接 下 来 我 们 看 看 棋子 的 定义 。 虽 然 扩 充 定义 的 棋盘 数学 模型 中 暗含 了 每 个 武将 棋子 的 信息 


(棋盘 上 对 应 的 格子 的 状态 只 是 武将 的 编号 ) 可 以 根据 这 些 信 


息 反 向 计算 出 每 个 武将 的 位 置 , 但 
是 出 于 算法 效率 的 原因 ， 我 们 仍然 用 一 个 单独 的 表 来 记录 每 个 武将 在 模 盘 上 的 位 置信 息 ,而 模 盘 


数组 元 素 的 值 就 是 对 应 的 武将 在 这 个 位 置 表 中 的 索引 ， 这 也 是 算法 设计 常用 的 “以 空间 换 时 间 ” 
的 策略 。 每 个 武将 ( 棋子 ) 有 两 个 属性 ， 即 位 置 和 棋子 类 型 。 我 们 用 行 和 列 的 值 组 合成 一 个 二 维 
坐标 来 表示 棋子 左上 角 的 位 置 , 棋子 其 他 部 分 占用 的 位 置 则 可 以 根据 棋子 类 型 推算 出 来 。 棋子 类 
型 一 共有 四 种 ,分 别 是 大 方块 (2x2 )、 横 长 方形 ( 2x1 )、 竖 长 方形 (1x2 ) 和 小 方块 (1x1 )， 可 
以 用 枚 举 类 型 来 表示 这 个 属性 。 武 将 的 数据 结构 定义 如 下 所 示 : 


typedef struct tagWARRIOR 


WARRIOR_TYPE type; 
int left; 
int top; 

J}WARRIOR; 


棋盘 采用 一 个 7x6 的 二 维 数组 表示 ， 一 个 游戏 局 面 的 完整 定义 如 下 : 
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struct HRD GAME STATE 
{ 


char board[HRD BOARD HEIGHT] [HRD BOARD WIDTH]; 
std: :vector<WARRIOR> heroes; 
MOVE_ACTION move; 
int step; 
HRD GAME STATE *parent; 
}; 


这 个 定义 中 除了 表示 棋盘 的 二 维 数组 之 外 , 还 有 一 个 存放 武将 信息 的 一 维 表 , 其 他 三 个 属性 
是 算法 设计 过 程 中 需要 的 附加 信息 ， 后 面 会 介绍 这 三 个 属性 的 意义 。 


20.2.2 ”算法 思路 


二 人 对 战 的 棋 类 游戏 一 般 采 用 博弈 树 相 关 算 法 处 理 棋 局 演化 状态 的 搜索 , 但 是 本 问题 仅仅 是 
棋盘 类 游戏 , 棋局 的 演化 和 搜索 都 可 以 采用 更 简单 的 方法 。 对 于 一 个 棋局 ， 如 果 有 一 种 或 多 种 移 
动武 将 的 方法 , 这 个 棋局 就 可 以 演化 成 一 个 或 多 个 新 的 棋局 ,每 个 新 的 棋局 又 可 以 根据 移动 武将 
的 方式 演化 成 更 多 的 棋局 。 很 显然 , 本 问题 的 棋局 搜索 空间 是 一 个 树 状 关系 空间 ， 对 树 状 空间 的 
搜索 既 可 以 采用 广度 优先 搜索 ,也 可 以 采用 深度 优先 搜索 。 本 书 的 第 5 章 和 第 6 章 介绍 的 状态 搜 
索 算法 都 采用 了 深度 优先 搜索 算法 ， 本 章 介绍 的 算法 将 采用 广度 优先 搜索 算法 。 

我 们 对 算法 的 要 求 是 : 给 定 一 个 华容 道 游 戏 的 开局 布局 , 可 以 得 到 这 个 开局 的 所 有 解决 方法 
(包括 最 少 武将 移动 步 又 的 方法 ) 以 及 相应 的 武将 移动 步 又 ， 要 求 算法 具有 通用 性 ， 能 处 理 任 何 
一 种 开局 的 华容 道 游戏 。 为 此 我 们 在 棋局 状态 定义 中 额外 增加 了 三 个 属性 ， 分 别 是 move 、step 
和 parent。move 是 当前 棋局 对 应 的 动作 ，step 记录 移动 的 步骤， 也 就 是 记录 move 动作 是 第 几 次 
移动 武将 ，parent 是 当前 棋局 的 “ 父 棋局 ”， 可 以 这 样 理解 parent 对 应 的 棋局 采用 move 动作 后 得 
到 当前 棋局 。 添 加 parent 的 目的 是 在 搜索 到 一 个 能 让 曹操 成 功 逃 脱 的 棋局 时 ， 通 过 parent 能 回 
漳 整 个 武将 移动 过 程 ， 输 出 移动 武将 的 步骤 。 

能 推动 棋局 变化 的 事件 是 在 棋盘 上 移动 武将 的 动作 (〈 Action )， 对 于 一 个 棋局 来 说 ， 一 个 动 
作 应 该 包含 两 个 信息 ， 其 一 是 动作 是 哪个 武将 产生 的 ,也 就 是 说 移动 的 是 哪个 武将 ; 其 二 是 动作 
的 方向 ， 根 据 华容 道 游戏 的 规则 ,合法 的 移动 方向 只 有 上 、 下 、 左 、 右 四 个 方向 。 动 作 的 定义 可 
以 这 样 实现 : 


typedef struct tagMOVE ACTION 
{ 


int heroIdx; 
int dirIdx; 
}MOVE_ACTION; 


我 们 定义 了 棋局 , 定义 了 武将 移动 的 动作 , 剩 下 工作 的 工作 就 是 找 出 移动 武将 ,驱动 棋局 状 
态 变 化 的 算法 。 移动 武将 , 实际 上 就 是 调整 武将 的 left 和 top 位 置 , 为 了 使 调整 算法 能 够 做 到 不 
依赖 具体 的 方向 ,一 致 性 处 理 向 四 个 方向 的 移动 , 我 们 再 次 使 用 了 方向 数组 技巧 。 首 先 将 方向 的 
定义 分 解 为 模 向 和 纵向 的 移动 量 ， 如 下 所 示 : 
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typedef struct tagDIRECTION 
{ 


int hd; 
int vd; 
}DIRECTION; 


所 谓 的 向 上 移动 棋子 , 其 实 就 是 在 保持 棋子 列 方向 位 置 不 变 , 将 棋子 整体 行 方向 减 1。 同 理 ， 
向 其 他 方向 移动 可 以 分 别 描述 为 对 相应 方向 行 或 列 坐标 的 加 1 或 减 1 计算 。 最 后 这 样 定 义 向 四 个 
方向 移动 的 方向 数组 : 

DIRECTION directions[MAX MOVE DIRECTION] = { {0, -1}, {1, 0}, {0, 1}, {-1, 0} }; 

这 样 做 的 好 处 是 循环 一 遍 这 个 方向 数组 , 将 每 个 方向 的 横向 和 纵向 移动 量 与 武将 的 当前 位 置 
车 加 ， 即 可 实现 向 四 个 方向 移动 武将 的 功能 ， 避 人 免 了 if( 向 上 )..if( 向 下 ).. 这 样 的 代码 。 

搜索 算法 的 核心 是 通过 动作 推动 棋局 的 转化 , 对 于 一 个 棋局 的 当前 状态 , 遍历 所 有 的 武将 棋 
子 ， 判 断 它们 能 和 否 移 动 ， 如 果 能 够 移动 ， 则 尝试 移动 它 ， 使 得 棋局 发 生变 化 得 到 一 个 新 的 棋局 。 
广度 优先 搜索 算法 通常 用 一 个 线性 表 存 储 所 有 棋局 , 按照 顺序 对 表 中 每 一 个 棋局 进行 搜索 ,如 果 
找到 新 棋局 则 添加 到 棋局 表 的 尾部 , 重复 这 个 搜索 过 程 直 到 结束 , 结束 条 件 是 搜索 到 期 望 的 结 
棋局 或 搜索 完 最 后 一 个 棋局 也 没有 再 产生 新 的 棋局 ( 棋局 表 已 经 空 了 )。 
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20.2 市 给 出 了 搜索 算法 的 原理 , 算法 原理 虽然 简单 ,但 是 实现 起 来 还 有 许多 具体 的 问题 需 
要 明确 。 首 先是 重复 棋局 的 问题 。 搜 索 过 程 中 肯定 会 出 现 之 前 已 经 处 理 过 的 棋局 ,重复 处 理会 
降低 算法 的 效率 ， 对 这 样 的 棋局 应 该 丢弃 。 要 做 到 这 一 点 ， 就 需要 设计 一 套 存 储 和 比较 棋局 的 

其 次 是 棋盘 状态 的 左右 镜像 的 问题 。 所 谓 的 左右 镜像 问题 , 就 是 两 个 棋局 虽然 武将 的 位 置 不 
一 样 ， 但 是 如 果 和 忽略 武将 的 名 字 信息 ， 单 纯 从 形状 上 看 是 左右 对 称 的 镜像 结构 ， 图 20-3 是 左右 
镜像 的 一 种 常见 情况 ， 图 20-4 则 是 另 一 种 左右 镜像 的 常见 情况 。 对 于 华容 道 游戏 来 说 ， 这 种 左 
右 镜像 的 情况 对 于 滑动 棋子 寻求 结果 的 影响 是 一 样 的 ， 也 就 是 说 ， 如 果 一 个 棋局 存在 一 个 80 步 
的 解 ， 则 它 的 左右 镜像 棋局 也 存在 一 个 80 步 的 解 ， 而 且 相 同形 状 的 棋子 的 移动 步 又 和 顺序 完全 
一 样 〈 当然 ， 对 武将 来 说 是 相同 形状 的 不 同 武将 ) 一 般 华 容 道 游戏 的 求解 算法 都 要 处 理 左右 镜 
像 的 情况 ,将 左右 镜像 视 为 相同 的 棋局 而 丢弃 掉 。 要 做 到 这 一 点 ， 就 需要 对 棋局 进行 模式 定义 并 
识别 出 左右 镜像 的 情况 。 

最 后 是 武将 的 连续 滑动 问题 。 根 据 华 容 道 游戏 的 规则 ， 武 将 的 连续 滑动 ( 1x1 的 小 方块 棋子 
比较 容易 出 现 ) 被 视 作 走 一 步 。 针 对 这 个 规则 ， 对 武将 的 每 次 位 置 移动 都 需要 做 特殊 的 判断 ， 滑 
动 一 次 和 滑动 两 次 虽然 对 最 后 的 结果 输出 都 是 一 步 , 但 是 中 间 会 得 到 两 个 不 同 的 棋局 , 对 这 两 个 
棋局 都 要 进行 处 理 。 

本 节 介 绍 算法 实现 时 将 会 遇 到 这 些 问题 ， 当 然 还 包括 其 他 问题 , 接 下 来 就 分 别 介绍 如 何 处 理 
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这 些 问题 ， 并 给 出 解决 这 些 问题 的 算法 。 


图 20-3 ”左右 镜像 的 常见 情况 之 一 图 20-4 ”左右 镜像 的 常见 情况 之 二 


20.3.1 棋局 状态 与 Zobrist 哈 希 算法 


华容 道 游 戏 中 棋子 的 位 置 和 棋盘 的 状态 是 标识 一 个 棋局 有 别 于 另 一 个 棋局 的 关键 数据 。 要 进 
行 棋 局 的 比较 判断 是 否 是 重复 处 理 过 的 棋局 , 就 必须 能 够 对 这 两 个 关键 数据 进行 存储 、 比 较 和 转 
换 。 既然 我 们 已 经 在 20.2.1 节 设 计 了 棋局 的 数据 结构 , 那 就 应 该 可 以 通过 逐个 比较 这 些 数 据 结构 
中 的 属性 的 值 来 判断 两 个 棋局 是 否 相 同 。 这 样 做 确实 可 以 , 但 并 不 是 高 效 的 算法 。 在 一 些 复杂 的 
棋 类 游戏 中 ， 棋 局 的 产生 数 以 亿 计 ， 直 接 对 缤纷 复杂 的 数据 逐个 比较 是 不 能 接受 的 。 

1. Zobrist 哈 希 算法 原理 

棋 类 游戏 中 通常 采用 各 种 哈 希 算法 对 棋局 进行 处 理 ,得 到 一 个 可 在 0(1) 时 间 复 杂 度 内 判断 是 
否 是 重复 棋局 的 哈 希 表 。Zobrist 哈 希 算法 是 一 种 适用 于 棋 类 游戏 的 棋局 编码 方式 ， 以 其 发 明 者 
Albert L. Zobrist 的 名 字 命 名 。Zobrist 哈 希 算法 通过 建立 一 个 特殊 的 置换 表 ， 对 棋盘 上 每 一 个 位 
置 的 所 有 可 能 状态 赋予 一 个 绝 不 重复 的 随机 编码 ， 通 过 对 不 同位 置 上 的 随机 编码 进行 异 或 计算 ， 
实现 在 极 低 冲突 率 的 前 提 下 将 复杂 的 棋局 编码 为 一 个 整数 类 型 哈 希 值 的 功能 。 

Zobrist 哈 希 算法 的 哈 希 编码 步 又 如 下 。 

(1) 识别 出 棋局 的 最 小 单位 (格子 或 交叉 点 )， 确 定 每 个 最 小 单位 上 的 所 有 可 能 的 状态 数 。 以 
华容 道 的 棋局 为 例 ， 最 小 单位 就 是 20 个 小 格子 ， 每 个 格子 有 5 种 状态 ， 分 别 是 空 状 态 、 被 横 长 
方形 占据 、 被 坚 长 方形 占据 、 被 小 方 格 占据 和 被 大 方 格 占据 。 

(2) 为 每 个 单位 上 的 所 有 状态 都 分 配 一 个 随机 的 编码 值 。 棋 类 游戏 一 般 需 要 “ 行 数 x 列 数 x 状 
态 数 ”个 状态 ， 以 华容 道 游戏 为 例 ， 编 码 值 采 用 32 位 ， 需 要 为 5x4x5=100 个 状态 分 配 编码 值 。 

(3) 对 指定 的 棋局 ， 对 每 个 单位 上 的 状态 用 对 应 的 编码 值 ( 随机 数 ) 做 异 或 运算 ， 最 后 得 到 
一 个 哈 希 值 。 


以 上 第 (1) 步 和 第 (2) 步 是 准备 阶段 ， 可 以 实现 计算 并 分 配 好 ， 只 有 第 3 步 是 需要 对 每 个 棋局 
进行 编码 计算 。 用 Zobrist 算法 产生 的 编码 值 是 个 随机 数 ， 表 面 上 看 起 来 好 像 和 棋局 没有 什么 关 
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系 , 但 是 如 果 棋 子 被 移动 过 ,相关 的 一 个 或 多 个 最 小 单位 上 的 状态 就 会 变化 ,于 是 对 应 的 编码 值 
也 就 变化 了 ,最 终 会 反映 到 棋局 的 哈 希 值 发 生变 化 。 也 就 是 说 ， 只 要 一 个 棋子 发 生变 动 ， 最终 得 
到 的 棋局 哈 希 值 也 会 变化 。 

Zobrist 哈 希 算法 有 两 大 优点 ,第 一 个 优点 是 冲突 概率 小 ， 只 要 随机 编码 值 的 范围 够 大 , 棋局 
哈 希 冲突 的 概率 非常 小 , 实际 应 用 中 基本 上 不 考虑 冲突 的 情况 ( 最 多 就 是 出 个 昏 招 输 掉 一 局 棋 )。 
第 二 个 优点 是 棋局 发 生变 化 时 , 不 必 对 整个 棋局 重新 计算 哈 希 值 ， 只 需要 计算 发 生变 化 的 那些 最 
小 单元 的 状态 变化 即 可 , 对 棋 类 游戏 算法 的 搜索 效率 来 说 , 这 是 一 个 非常 诱 人 的 红利 。 举 个 例子 ， 
如 果 把 华容 道 游 戏 的 一 个 “小 鞭 ” 从 A 位 置 移 到 B 位 置 ， 棋 局 发 生 了 变化 ， 但 是 不 需要 重新 计 
算 整 个 棋盘 上 的 状态 ， 只 需要 计算 A 和 B 两 个 位 置 的 变化 。 首 先 ，A 位 置 的 状态 从 1 (1x1 的 小 
方块 的 类 型 值 ) 变化 成 空 状态 (0 ), 这 时 候 只 需要 将 A 位置 上 状态 1 对 应 的 编码 值 与 棋局 的 哈 希 
值 再 做 一 次 异 或 运算 。 根 据 异 或 运算 的 特点 ， 就 相当 于 “小 洽 ” 从 A 位置 上 “删除 了 ”， 然 后 再 
将 A 位置 上 空 状态 对 应 的 编码 值 与 棋局 的 哈 希 值 做 异 或 运算 ， 相 当 于 将 A 位 置 改变 为 空 状态 。 
对 A 位置 处 理 完 ， 继 续 对 B 位 置 进行 处 理 ，B 位 置 的 处 理 与 A 位置 的 处 理 一 样 ， 先 将 B 位 置 上 
空 状态 对 应 的 编码 值 与 棋局 的 哈 希 值 做 一 次 异 或 运算 ,再 将 B 位 置 上 状态 1 对 应 的 编码 值 与 棋局 
的 哈 希 值 做 一 次 异 或 运算 。 原 来 棋局 的 哈 希 值 经 过 四 次 异 或 运算 后 得 到 的 值 就 是 新 棋局 的 哈 希 
值 ， 这 就 是 Zobrist 哈 希 算法 增 量 计算 的 优点 。 实 际 上 , 我 们 会 将 棋盘 的 空 状 态 的 值 设 为 0, 这 样 
一 来 ， 与 空 状态 进行 的 两 次 异 或 状态 就 没有 必要 了 ( 与 0 异 或 不 改变 原 值 )， 最 终 只 需 两 次 异 或 
运算 就 可 以 得 到 新 棋局 的 哈 希 值 。 

2. Zobrist 哈 希 算法 实现 

实现 Zobrist 哈 希 算法 首先 要 定义 编码 表 ， 编 码 表 是 针对 棋局 定义 的 。 根 据 上 一 节 的 描述 ， 
很 显然 这 是 一 个 三 维 的 表 , 为 了 更 清晰 地 表达 这 个 表 的 结构 , 我 们 将 这 个 三 维 表 分 成 最 小 单元 定 
义 和 最 小 单元 的 状态 定义 两 个 数据 结构 ， 如 下 所 示 : 


typedef struct tagCellState 
{ 


int value[MAX WARRIOR TYPE]; 
}CELL STATE; 


typedef struct tagzobristHash 
{ 


CELL STATE key[HRD GAME ROW][HRD GAME COL]; 
}ZOBRIST_HASH; 


对 于 复杂 的 棋 类 游戏 ， 一 般 认 为 采用 64 位 整数 编码 是 安全 的 ， 但 是 对 于 华容 道 这 样 简单 的 
局 面 ， 我 们 觉得 用 32 位 整数 表示 随机 编码 就 足够 了 ， 因 此 value 的 定义 用 的 是 无 符号 整数 。 

计算 整个 棋局 的 哈 希 值 的 过 程 就 是 首先 初始 化 哈 希 值 为 0， 然 后 对 20 个 棋盘 格子 逐个 处 理 ， 
根据 棋盘 格子 的 武将 编号 信息 获取 武将 的 类 型 ( 也 就 是 棋盘 格子 的 状态 )， 根 据 武 将 类 型 获取 该 
类 型 对 应 的 编码 值 , 用 此 编码 值 参与 哈 希 值 进行 异 或 运算 ,处 理 完 所 有 期 盼 格子 后 的 哈 希 值 就 是 
最 终 的 结果 。 完 整 的 算法 实现 如 GetZzobristHash() 函 数 所 示 。 
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unsigned int GetZobristHash(ZOBRIST HASH *zob hash, HRD GAME STATE *state) 


{ 
unsigned int hash = 0; 
const std: :vector<NARRIOR>& heroes = state->heroes; 
for(int i = 1; i <= HRD GAME ROW; i++) 
{ 
for(int j = 1; j <= HRD GAME COL; j++) 
{ 
int index = state->board[i][j] - 1; 
int type = (index != 0) ? heroes[index].type : 0; 
hash ^= zob hash->key[i - 1][j - 1].value[type]; 
J 
return hash; 
} 


Zobrist 哈 希 算法 的 一 个 主要 优点 就 是 当 模 局 发 生变 化 时 , 只 需要 计算 变化 的 部 分 就 可 以 得 到 
新 棋局 的 哈 希 值 。 这 一 点 在 GetZobristHashUpdate() 哨 数 中 得 到 体现 ,将 编号 为 heroIdx 的 武将 棋 
子 向 dirIdx 指定 的 方向 移动 一 步 后 , 这 个 函数 只 重新 计算 移动 武将 模子 所 影响 的 几 个 位 置 就 可 以 
得 到 新 的 棋局 的 哈 希 值 。 


unsigned int GetZobristHashUpdate(ZOBRIST_HASH *zob hash, HRD GAME STATE *state, int heroIdx, int 
dirIdx) 
{ 


unsigned int hash = state->hash; 
Const WARRIOR& hero = gameState->heroes[heroIdx]; 
const DIRECTION& dir = directions[dirIdx]; 


switch(hero.type) 


{ 
case HT_VBAR: 
// 原 始 位 置 的 处 理 : 
hash ^= zob hash->key[hero.left][hero.top].value[hero.type]; 
hash ^= zob_hash->key[hero.left][hero.top + 1].value[hero.type]; 
hash ^= zob_hash->key[hero.left][hero.top].value[0]; //0 是 空 状态 
hash ^= zob hash->key[hero.left][hero.top + 1].value[o]; 
// 新 位 置 的 处 理 : 
hash ^= zob hash->key[hero.left + dir.hd][hero.top + dir.vd].value[0];//0 是 空 状态 
hash ^= zob hash->key[hero.left + dir.hd]j[hero.top + dir.vd + 1].value[o]; 
hash ^= zob_hash->key[hero.left + dir.hd][hero.top + dir.vd].value[hero.type]; 
hash ^= zob hash->key[hero.left + dir.hd]j[hero.top + dir.vd + 1].value[hero.type]; 
break; 
} 


return hash; 


} 


20.3.2 ”重复 棋局 和 左右 镜像 的 处 理 
重复 棋局 的 判断 依赖 于 Zobrist 哈 希 算法 对 棋局 计算 出 的 哈 希 值 。 搜 索 算法 用 一 个 集合 存放 
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已 经 处 理 过 的 棋局 的 哈 希 值 ， 集 合 中 的 元 素 没 有 重复 ， 我 们 可 以 利用 STL 的 std: :set 容器 。 搜 
索 算 法 在 搜索 棋局 的 过 程 中 ， 每 产生 一 个 新 的 棋局 ， 就 调用 AddNewStatepPattern() 函 数 判断 是 否 
是 重复 的 棋局 。 这 个 函数 就 是 查 这 个 哈 希 值 的 集合 ， 如 果 已 经 存在 相同 的 棋局 ， 则 返回 false， 
否则 就 返回 true, 并 将 新 棋局 的 哈 希 值 加 入 到 这 个 集合 中 ,同时 新 棋局 加 入 到 棋局 队列 中 ,这 个 
其 局 队列 是 广度 优先 搜索 算法 需要 的 搜索 队列 。 


bool AddNewStatepPattern(HRD_GAME& game, HRD GAME STATE* gameState) 
{ 


Et 


unsigned int l2rHash = GetZobristHash(&zob hash, gameState); 
if(game.zhash.find(12rHash) == game.zhash.end()) 


{ 
game.zhash.insert(12rHash); 
#if NO_LR_MIRROR ALLOW 
unsigned int r2lHash = GetMirrorZzobristHash(8&zob_hash, gameState); 
game.zhash.insert(r2lHash); 


#endif 
game.states.push back(gameState); 


return true; 


| 
return false; 
} 
AddNewStatepattern() 函 数 内 部 对 左右 镜像 的 情况 也 做 了 处 理 ， 调 用 GetMirrorZzobristHash() 
函数 计算 镜像 棋局 的 哈 希 值 。 求 镜像 棋局 的 哈 硕 值 不 需要 先 求 出 镜像 棋局 再 计算 哈 希 值 , 可 以 用 
Zobrist 哈 希 算法 的 特性 , 通过 对 调 左右 两 列 的 状态 编码 值 的 方式 , 直接 在 原 棋局 上 计算 镜像 棋局 
的 哈 希 值 ， 请 看 GetMirrorZobristHash() 函 数 的 实现 代码 。 


unsigned int GetMirrorZzobristHash(ZOBRIST_ HASH *zob hash, HRD GAME STATE *state) 
{ 


Ne 


a 


unsigned int hash = 0; 
const std: :vector<NARRIOR>& heroes = state->heroes; 
for(int i = 1; i <= HRD GAME ROW; i++) 


{ 
for(int j = 1; j <= HRD GAME COL; j++) 
int index = state->board[i][j] - 1; 
int type = (index >= 0 88 index < heroes.size()) ? heroes[index].type : 0; 
//(HRD GAME COL - 4) - (j - 1)) 
hash ^= zob hash->key[i - 1][HRD GAME COL - j].value[type]; 
} 
} 


return hash; 


} 

GetMirrorZobristHash() 困 数 与 GetzobristHash() 函 数 的 区 别 就 是 将 key 的 列 下 标定 位 由 j - 1 
改 成 了 HRD GAME COL - j， 相 当 于 将 第 1 列 的 状态 编码 值 和 第 4 列 的 状态 编码 值 交 换 ， 将 第 2 列 
的 状态 编码 值 与 第 3 列 的 状态 编码 值 交 换 ， 这 样 交 换 后 直接 对 当前 棋局 进行 计算 ,得 到 的 就 是 其 
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镜像 棋局 的 哈 希 值 。NO_LR_MIRROR_ALLOW 是 编译 控制 ， 决 定 算法 搜索 过 程 中 是 否 排除 镜像 棋局 ， 
如 果 要 排除 镜像 棋局 ,就 需要 将 GetMirrorzobristHash() 哨 数 计算 出 来 的 镜像 棋局 的 哈 希 值 也 加 入 
到 已 经 处 理 过 的 棋局 哈 希 值 集合 中 ， 从 而 避免 在 后 序 的 搜索 过 程 中 再 重复 处 理 到 镜像 棋局 。 


20.3.3 ”正确 结果 的 判断 条 件 


很 显然 ， 当 代表 曹操 的 大 方块 棋子 出 现在 棋盘 下 部 的 中 央 缺 口 位 置 的 时 候 ， 游 戏 就 结束 了 。 
根据 之 前 对 武将 的 定义 , 这 个 条 件 其 实 就 是 代表 曹操 的 棋子 的 左上 角 位 置 位 于 [1, 3] 时 。 现在 问题 
是 , 哪个 棋子 代表 曹操 ?可 以 约定 武将 数据 初始 化 时 第 一 个 武将 总 是 曹操 , 也 可 以 使 用 一 个 属性 
保存 曹操 的 棋子 编号 ， 以 便 可 以 随时 找到 曹操 (传说 中 的 “说 曹操 ， 曹 操 到 ”)。 我 们 的 算法 采用 
第 二 种 方式 ， 在 HRD_GAME 的 定义 中 增加 一 个 表示 曹操 编号 的 属性 。2.3.2 节 介绍 AddNewstate 
pattern() 函数 的 时 候 已 经 引用 了 这 个 定义 ，HRD_GAME 的 完整 定义 如 下 : 

typedef struct tagHRD GAME 

{ 


d::string gameName; 
d::vector<std: :string> heroNames; 
har caoIdx; 
d::deque<HRD GAME STATE *> states; 
td: :set<unsigned int> zhash; 
int result; 
J}HRD_GAME; 
gameName 和 heroNames 的 定义 是 为 了 使 得 输出 结果 更 具 趣味 性 ，caoIdx 就 是 曹操 棋子 的 编号 ， 
states 是 广度 优先 搜索 算法 需要 的 棋局 队列 ，zhash 是 棋局 喻 希 表 ，result 记录 搜索 算法 结束 后 


找到 了 几 种 正确 的 解 。 
完成 以 上 数据 结构 定义 ， 就 可 以 用 IsEscaped() 困 数 进行 是 否 得 到 正确 游戏 结果 的 判断 了 ， 
这 个 函数 的 实现 非常 简单 ， 就 是 判断 曹操 棋子 的 左上 角 坐 标 是 否 是 [1, 3]。 


bool IsEscaped(HRD GAME& game, const HRD GAME STATE* gameState) 
{ 


mwmD wm wm 


return (gameState->heroes[game.caoIdx - 1].left == CAO ESCAPE LEFT) 
&& (gameState->heroes[game.caoIdx - 1].top == CAO ESCAPE TOP); 
} 


20.3.4 武将 棋子 的 移动 

这 一 节 我 们 讨论 华容 道 游戏 棋盘 上 武将 棋子 的 移动 问题 。 移 动武 将 棋子 相当 于 产生 了 新 状 
态 ， 所 以 移动 棋子 也 是 棋局 搜索 算法 的 基础 。 从 数据 的 角度 理解 棋子 的 移动 ， 就 是 将 棋盘 中 武将 
所 在 位 置 的 信息 清除 ， 然 后 在 新 位 置 上 设置 武将 的 信息 。 这 就 是 武将 棋子 移动 算法 的 实现 方法 ， 
在 棋局 上 移动 棋子 需要 两 个 信息 ， 一 个 是 武将 的 编号 ， 另 一 个 是 移动 方向 。 


移动 武将 棋子 之 前 首先 要 判断 能 否 移动 这 个 武将 棋子 。 判 断 的 依据 有 两 个 ,首先 ,不 能 移出 
边界 ; 其 次 , 新 位 置 上 不 能 有 其 他 武将 棋子 。 这 很 容易 理解 ,但 是 编写 算法 实现 要 考虑 周到 。 之 
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前 我 们 在 设计 棋盘 时 在 棋盘 四 周 设置 了 哨兵 位 , 这 样 我 们 在 设计 算法 时 就 不 需要 再 单独 判断 每 次 
移动 是 否 超 出 边界 了 ， 只 需 关 注 新 位 置 是 否 被 其 他 武将 棋子 占用 即 可 。 新 位 置 如 果 是 0， 表 示 空 
位 置 , 非 0 则 表示 被 其 他 武将 棋子 (包括 边界 ) 占用 。 但 是 一 点 需要 注意 的 是 ,在 棋盘 上 移动 棋 
子 ， 多 数 情况 下 都 只 能 移动 一 个 格子 的 位 置 ， 对 块 涉 比较 大 、 需 要 占用 多 个 格子 的 武将 棋子 , 需 
要 考虑 位 置 重 辣 的 情况 。 以 横 长 方形 的 棋子 为 例 ， 如 果 癌 右 移动 一 个 格子 , 横 长 方形 右边 格子 和 
左边 格子 的 判断 条 件 有 点 区 别 , 右边 格子 需要 判断 新 位 置 是 否 是 空 , 左边 格子 因 位 置 重 着 不 需要 
做 判断 。 如 果 向 左 移动 则 刚好 相反 ， 左 边 格 子 需 要 判断 新 位 置 是 否 是 空 ， 又 边 格 子 因 位 置 重 车 不 
需要 做 判断 。 那 么 是 否 需 要 对 不 同 的 移动 方向 做 不 同 的 处 理 呢 ? 答案 是 否定 的 , 因为 如 果 这 样 做 
就 违背 了 我 们 当初 将 移动 方向 设计 为 数组 的 初 囊 。 因 为 每 个 武将 的 编号 不 同 , 这 个 给 算法 的 重生 
判断 提供 了 依据 , 对 于 横 长 方形 的 两 个 格子 不 需要 根据 方向 做 区 别处 理 , 只 要 判断 如 果 新 位 置 是 
0， 表 示 新 位 置 是 空 可 以 移动 ,如 果 新 位 置 是 当前 武将 的 编号 ， 则 说 明 是 位 置 重合 ,也 可 以 移动 。 
具体 代码 实现 请 看 CanHeroMove() 函数 。 


bool CanHeroMove(HRD GAME STATE* gameState, int heroIdx, int dirIdx) 
让 

int cv1,cv2,cVv3,cVv4; 

bool canMove = false; 

Const WARRIOR& hero = gameState->heroes[heroIdx]; 

const DIRECTION& dir = directions[dirIdx]; 


switch(hero.type) 


{ 


case HT_VBAR: 
cv1 = gameState->board[hero.top + dir.vd + 1][hero.left + dir.hd + 1]; 
cv2 = gameState->board[hero.top + dir.vd + 2][hero.left + dir.hd + 1]; 
canMove = (cv1 == BOARD CELL EMPTY || cv1 == heroIdx) 8& (cv2 == BOARD CELL EMPTY || cv2 == 
heroIdx); 
break; 


return canMove; 


} 
MoveHeroToNewState() 也 数 移动 武将 棋子 产生 新 棋局 ,这 个 函数 的 核心 操作 就 是 判断 是 否 能 移 
动 棋子 ， 如 果 能 移动 棋子 就 产生 一 个 新 状态 , 清除 原 位 置 上 的 棋子 信息 ,在 新 位 置 上 设置 棋子 信 
息 ， 其 他 的 代码 都 是 处 理 辅 助 数据 的 。 


HRD_ GAME STATE* MoveHeroToNewState(HRD GAME STATE* gameState, int heroIdx, int dirIdx) 


{ 
if(CanHeroMove(gameState, heroIdx, dirIdx)) 


HRD GAME STATE* newState = new HRD GAME STATE; 
if(newState != NULL) 


CopyGameState(gameState, newState); 
WARRIOR& hero = newState->heroes[heroIdx]; 
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const DIRECTION& dir = directions[dirIdx]; 


ClearPosition(newState, hero.type, hero.left, hero.top); 

TakePosition(newState, heroIdx, hero.type, hero.left + dir.hd, hero.top + dir.vd); 
hero.left = hero.left + dir.hd; 

hero.top = hero.top + dir.vd; 


newState->step = gameState->step + 1; 
newstate->parent = gameState; 
newState->move.heroIdx = heroIdx; 
newState->move.dirIdx = dirIdx; 
return newState; 


} 
return NULL; 
} 
根据 华容 道 游戏 规则 ,对 一 个 武将 棋子 连续 移动 只 算 一 步 。 如果 搜 索 算法 只 是 确定 指定 的 局 
面 是 否 有 解 ， 这 个 规则 实际 上 对 算法 没有 影响 ， 如 果 需 要 输出 移动 的 步骤 并 计算 最 小 移动 步骤， 
则 必须 考虑 这 个 问题 。 在 每 一 步 移 动 成 功 以 后 , 继续 对 该 棋子 尝试 移动 , 但 是 移动 的 方向 有 限制 ， 
不 能 向 原 方向 移动 。 


void TryHeroContinueMove(HRD GAME& game, HRD GAME STATE* gameState, int heroIdx, int lastDirIdx) 
: 


jnt ds Os 
/# 向 四 个 方向 试探 移动 #/ 
for(d = 0; d < MAX MOVE DIRECTION; d++) 
{ 
if(!IsReverseDirection(d，lastDirIdx)) /* 不 向 原 方向 移动 */ 
{ 
HRD_ GAME STATE *newState = MoveHeroToNewState(gameState, heroIdx, d); 
if(newState != NULL) 
{ 
if(AddNewStatepattern(game, newState)) 
{ 
newState->step--; 
} 
else 
delete newState; 
return; 
} 
} 


} 
判断 两 个 方向 是 否 是 反方 向 ， 不 需要 写 一 堆 if 语句 ， 青 次 体现 了 方向 数组 的 好 处 : 


bool IsReverseDirection(int dirIdx1, int dirIdx2) 


{ 
} 


return ( ((dirIdx1 + 2) % MAX MOVE DIRECTION) == dirIdx2); 
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20.3.5 ”棋局 的 搜索 算 
华容 道 游戏 的 求解 过 程 就 是 棋局 的 搜索 过 程 , 搜索 的 过 程 其 实 也 是 棋局 生成 的 过 程 。 移 动 一 


个 棋子 会 使 棋盘 状态 产生 一 个 新 棋局 ， 而 移动 另 一 个 棋子 则 会 产生 另 一 个 不 同 的 新 棋局 。 此 外 ， 


对 于 同一 个 棋子 ,向 不 同 的 方向 移动 也 会 产生 不 同 的 新 棋局 。 搜 索 算法 开始 的 时 候 , 棋局 队列 中 
只 有 一 个 元 素 , 就 是 游戏 的 开局 状态 。 搜 索 算法 每 次 从 棋局 队列 中 取出 一 个 棋局 , 首先 判断 是 否 
是 结束 状态 ， 如 果 是 结束 状态 ， 就 输出 结果 ， 和 否则 就 对 这 个 棋局 尝试 各 种 移动 武将 棋子 的 操作 ， 
新 产生 的 棋局 如 有 果 之 前 没有 出 现 重复 的 新 棋局 ， 就 加 入 到 棋局 队列 。 


bool ResolveGame(HRD GAME8 game) 
{ 


int index = 0; 
while(index < static cast<int>(game.states.size())) 


HRD_GAME STATE *gameState = game.states[index]; 
if(IsEscaped(game, gameState)) 


game.result++; 
OutputMoveRecords (game, gameState); 
} 


else 


{ 
} 


SearchNewGameStates(game, gameState); 


index++; 


} 


return (game.result > 0); 


SearchNewGameSstates() 函 数 对 棋盘 上 的 武将 和 可 能 的 移动 方向 进行 组 合 枚 举 ， 驱 动 搜索 算法 
产生 新 的 棋局 状态 ， 这 是 一 个 两 重 循环 ， 也 是 组 合 类 枚 举 惯 用 的 方法 : 


void SearchNewGameStates(HRD GAME& game, HRD GAME STATE* gameState) 


{ 
for(int i = 0; i < static cast<int>(gameState->heroes.size()); i++) 
{ 
for(int j = 0; j < MAX MOVE DIRECTION; j++) 
TrySearchHeroNewState(game, gameState, i, j); 
} 
} 
} 


TrySearchHeroNewState() 子 数 尝试 对 编号 为 i 的 武将 向 j 指定 的 方向 移动 , 如 果 可 以 通过 移动 
棋子 产生 新 的 棋局 ( MoveHeroToNewState() 函 数 负 责 做 这 个 工作 )， 就 根据 游戏 规则 继续 尝试 能 否 
连续 移动 。 如 果 新 棋局 是 重复 棋局 ( AddNewStatePattern() 函 数 负责 做 这 个 判断 ) 或 移动 无 法 在 这 
个 方向 移动 ， 就 忽略 这 个 武将 棋子 和 移动 方向 的 组 合 。 
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void TrySearchHeroNewState(HRD GAME& game, HRD GAME STATE* gameState, int heroIdx, int dirIdx) 


HRD_ GAME STATE *newState = MoveHeroToNewState(gameState, heroIdx, dirIdx); 
if(newState != NULL) 


if(AddNewStatepattern(game, newState)) 
/* 尝 试 连续 移动 ， 根 据 华容 道 游戏 规则 ， 连 续 的 移动 也 只 算 一 步 */ 


TryHeroContinueMove(game, newState, heroIdx, dirIdx); 
return; 


} 


delete newState; 
} 
} 


至 此 , 搜索 算法 都 完整 了 , 结合 之 前 的 游戏 和 棋局 定义 , 就 可 以 求解 各 种 华容 道 游戏 开局 了 。 


20.4 总结 


最 后 不 出 所 料 ， 我 们 的 算法 找到 了 “ 横 刀 立马 ”开局 的 最 快 81 步 解 法 ， 当 然 ， 还 有 “指挥 
若 定 ”的 73 步 解法 ,“ 比 经 横 空 ”的 28 步 解 法 ， 等 等 。 广 度 优先 搜索 算法 有 助 于 快速 找到 解决 
步骤 最 少 的 解法 ， 通 常 第 一 个 输出 的 结果 就 是 最 快 的 解决 方法 。 

为 了 使 得 算法 对 华容 道 游 戏 的 结果 输出 更 有 趣味 ， 我 们 的 算法 采用 了 单独 的 数组 heroes 存 
放 武 将 信息 ， 事 实证 明 这 极 大 地 影响 了 算法 的 速度 。 新 棋局 产生 时 复制 棋局 数据 操作 是 个 瓶颈 ， 
可 以 对 此 做 出 优化 , 比如 将 武将 信息 压缩 到 一 个 32 位 整数 中 , 直接 存放 在 board 中 ( 需要 将 board 
改 成 int 类 型 )， 有 兴趣 的 读者 可 自行 优化 这 个 算法 。 


20.5 参考 资料 


[1] Cormen TH, etal. Introduction to Algorithms (Second Edition). The MIT Press, 2001 
[2] 维基 百科 : http://zh.wikipedia.org/wiki/ 华 容 道 
[3] Surhone L M, Timpledon M T, Marseken SF. Zobrist Hashing. Vdm Publishing House, 2010 


第 包 7 说 
A* 寻 径 算 法 


我 最 初 接触 计算 机 是 从 游戏 开始 的 ， 最 早 是 DOS 时 代 的 RPG 游戏 (Role-Playing Game， 角 
色 扮 演 游戏 ) 只 需 鼠 标 一 点 ， 游 戏 中 的 人 物 或 精灵 就 会 绕 过 各 种 障碍 物 ， 沿 着 一 条 最 近 的 道路 
到 达 指 定 的 位 置 。 那 时 候 我 对 各 种 算法 没有 概念 , 一直 很 好 奇 这 是 怎么 实现 的 。 我 也 模仿 着 做 了 
一 个 可 以 用 鼠标 控制 精灵 在 地 图 上 移动 的 小 程序 ， 但 是 可 下地 使 用 了 类 似 迷宫 游戏 的 穷 举 算法 ， 
后 来 才 知 道 原来 大 家 都 用 A* 算 法 。A* 算 法 其 实 是 一 类 启发 式 搜索 算法 的 基础 ， 传 统 上 用 作 寻 径 
( 寻 路 ) 算法 , 但 是 A* 算 法 的 思想 并 不 仅 限于 游戏 中 的 寻 径 算法 。 

A* 算 法 虽然 名 字 很 神秘 ,但 是 算法 的 原理 和 实现 都 很 简单 。 本 章 我 们 将 介绍 A* 算 法 ， 作 为 
对 比 ， 我 们 首先 会 介绍 Dijkstra( 迪 杰 斯 特 拉 ) 算法 。 游 戏 中 的 寻 径 算 法 一 般 不 会 使 用 Dijkstra 
算法 ,但 是 作为 一 种 不 带 任何 启发 思想 的 广度 优先 搜索 算法 ， 刚 好 可 以 和 A* 算 法 做 个 对 比 。 我 
们 编写 了 一 个 寻 径 算法 对 比 演示 程序 ， 在 一 个 16 x 16 个 小 方 格 组 成 的 模拟 地 图 上 用 图 示 的 方法 
直观 地 展示 各 种 算法 的 搜索 方式 和 搜索 效率 ， 以 及 各 种 距离 评估 函数 对 A* 算 法 的 影响 。 

21.1 寻 径 算法 演示 程序 

Dijkstra 算 法 与 A* 算 法 有 很 大 的 差异 , A* 算 法 比较 适合 用 于 二 维 平面 地 图 上 的 寻 径 算法 , 如 
果 用 人 小 方 格 模拟 地 图 ，A* 算 法 的 结果 可 以 直接 输出 成 小 方 格 的 状态 ， 而 Dijkstra 算法 则 需要 做 一 
些 转 换 , 需要 将 小 方 格 描述 的 二 维 平面 地 图 转化 成 带 权 有 向 图 。 设计 这 个 演示 程序 并 不 是 本 章 的 
重点 , 但 是 为 了 输出 的 效果 ,我 们 需要 对 算法 定义 的 数据 结构 进行 调整 ,使 我 们 给 出 的 算法 实现 
能 够 输出 符合 演示 程序 要 求 的 数据 结构 和 数据 。 

在 一 个 16 x 16 个 小 方 格 组 成 的 模拟 地 图 上 ， 每 个 小 方 格 有 不 同 的 状态 、 类 型 和 标志 ， 我 们 
用 不 同 的 颜色 表示 这 些 属性 。 我 们 给 出 的 小 方 格 属性 定义 CELL 如 下 : 

a struct tagCell 


int node idx; 
int type; //0:normal,1:mark,2:wall,3:source,4:target 
bool inpath; 
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bool processed; 
}CELL; 


type 是 0 表示 这 是 一 个 普通 的 小 方 格 ，1 表示 需要 特殊 标记 ，2 表示 这 个 小 方 格 代表 的 是 类 
似 墙 一 样 的 障碍 物 ，3 表示 这 个 小 方 格 是 寻 径 的 起 点 ，4 表示 这 个 小 方 格 是 寻 径 的 终点 。inpath 
表示 这 个 小 方 格 是 否 在 最 后 找到 的 最 短路 径 上 ，processed 表示 这 个 小 方 格 是 否 被 搜索 算法 处 理 
过 。 每 种 寻 径 算法 最 后 的 结果 都 输出 在 GRID_CELL 中 ， 以 便 演 示 程 序 能 够 以 一 致 的 方式 显示 各 种 
算法 的 结 


typedef struct tagGridCell 


CELL cell[N SCALE][N SCALE]; 
}GRID CELL; 


对 于 Dijkstra 算法， 还 需要 将 以 矩阵 方式 描述 的 地 图 ( 小 方 格 ) 状态 转化 为 带 权 有 向 图 。 转 
化 的 原则 就 是 小 方 格 和 矩阵 中 每 个 小 方 格 视 作 带 权 有 向 图 中 的 一 个 顶点 (被 标记 为 障碍 物 的 小 方 格 
不 作为 顶点 )， 两 个 直接 相 邻 的 小 方 格 〈 顶点 ) 视 作 有 一 条 权 为 1 的 边 将 它们 相连 。 如 果 用 邻接 
和 矩阵 的 方式 描述 带 权 有 向 图 ， 则 Dijkstra 算法 所 用 到 的 数据 结构 可 描述 为 : 


typedef struct tagDijkstraGraph 


std: :vector<GNODE> nodes; 
int adj[N_NODE][N NODE]; 
int prev[N NODE]; 
int dist[N NODE]; 
int source; 
int target; 

}DIJKSTRA GRAPH; 


其 中 nodes 是 顶点 集合 ，adj 是 邻接 矩阵 ， 其 他 4 个 属性 是 与 Dijkstra 算法 相关 的 变量 ，21.2 
节 具 体 介绍 Dijkstra 算法 时 再 对 它们 做 详细 说 明 。 

对 于 A* 算 法 ,本 身 就 适合 用 和 矩阵 方式 描述 地 图 , 不 需要 转化 为 有 向 图 ， 因 此 用 于 A* 算 法 的 
数据 结构 可 直接 描述 为 : 


typedef struct tagAStarGraph 


int grid[N SCALE][N SCALE]; 
std: :multiset<ANODE, compare> open; 
std: :vector<ANODE> close; 
ANODE source; 
ANODE target; 
J}ASTAR_GRAPH; 


其 中 grid 直接 描述 这 个 小 方 格 和 矩阵 ， 其 他 4 个 属性 是 与 A* 算 法 有 关 的 变量 ，21.3 节 具 体 介 
绍 A* 算 法 时 再 对 它们 做 详细 说 明 。 


21.2” ”Dijkstra 算法 
Dijkstra 算法 是 典型 的 单 源 最 短路 径 算法 ， 任 何 一 本 介绍 图 论 或 数据 结构 的 书 都 会 介绍 这 种 
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算法 。Dijkstra 算法 适用 于 求解 没有 负 权 边 的 带 权 有 向 图 的 单 源 最 短路 径 问题 ， 所 谓 的 单 源 可 以 
理解 为 一 个 出 发 点 ,Dijkstra 算 法 可 以 求 得 从 这 个 出 发 点 到 图 中 其 他 顶点 的 最 短路 径 。 由 于 Dijkstra 
算法 使 用 广度 优先 搜索 策略 ， 它 可 以 一 次 得 到 所 有 点 的 最 短路 径 。Dijkstra 算法 在 各 种 地 图 软件 
中 得 到 了 广泛 的 应 用 ,假如 我 们 把 一 个 地 区 的 交通 网 用 带 权 有 向 图 表示 , 其 中 城市 就 是 图 的 顶点 ， 
边 就 是 连接 城市 之 间 的 道路 ， 边 的 权 就 是 城市 之 间 的 距离 ， 就 可 以 用 Dijkstra 算 法 求解 从 一 个 城 
市 到 男 一 个 城市 的 最 短路 径 。 由 此 可 见 ， 地 图 软件 中 的 这 个 实用 功能 背后 就 是 简单 的 Dijkstra 算 
法 在 支撑 ， 本 节 我 们 来 介绍 一 下 Dijkstra 算 法 。 


21.2.1 ”Dijkstra 算法 原理 


设 G=(V,E) 是 一 个 带 权 有 向 图 ， 其 中 s 是 起 始点 。Dijkstra 算 法 的 思想 就 是 用 一 个 表 存 放 当 前 
找到 的 从 s 到 每 个 顶点 vj 的 最 短路 径 ， 称 其 为 dist 表 。dist 表 的 初始 状态 是 dist[s]=0， 若 存在 与 s 
直接 相连 的 顶点 m， 则 记录 dist[m] 王 Ws, m)， 其 中 Ws, m) 就 是 连接 s 和 m 的 边 的 权 。 对 于 其 他 与 
s 不 直接 相连 的 顶点 w, 记录 dist[vi]=+%。Dijkstra 算 法 的 基本 操作 就 是 用 广度 优先 搜索 策略 处 理 
每 一 个 顶点 ， 对 与 之 相关 的 边 进行 拓展 。 扩 展 边 的 方法 是 : 如 果 存 在 一 条 从 2 到 六 的 边 ,， 那么 从 
s 到 vj 的 最 短路 径 可 以 通过 将 边 Wu, v) 添 加 到 尾部 来 拓展 一 条 从 s 到 vw 的 路 径 。 这 条 路 径 的 长 度 
是 dist[u] + Wu, v) ,如 果 这 个 值 比 目 前 已 知 的 dist[v] 的 值 要 小 , 则 使 用 这 个 新 值 来 蔡 代 当前 dist[vj] 
的 值 ， 如 果 这 个 值 比 目前 已 知 的 dist[vj] 的 值 大 ， 则 不 做 任何 动作 。 


21.2.2 ”Dijkstra 算法 实现 


Dijkstra 算法 在 搜索 过 程 中 需要 维护 两 个 顶点 的 集合 8 和 0O, 集合 5 中 存放 所 有 已 知 dist[vi] 都 
已 经 是 最 短路 径 的 顶点， 其 余 的 顶点 都 在 集合 O 中 。 初 始 时 8 集合 为 空 ， 算 法 每 次 从 集合 O 中 选 
择 一 个 顶点 u, 其 距离 dist[u] 的 值 最 小 (起 点 s 总 是 被 第 一 个 选中 , 因为 dist[s] 的 初始 状态 总 是 0 )， 
将 wu 从 OO 中 移 到 5 中， 然后 对 每 一 条 与 相连 的 边 Wlw, wv) 进行 扩展 ， 具 体 的 算法 步 又 如 下 。 

(1) 初始 化 集合 S 和 QO， 设 起 点 dist[s]=0， 并 将 其 他 顶点 的 dist[ 由 设 为 无 穷 大 ; 

(2) 从 2 中 选择 一 个 dist[u] 值 最 小 的 顶点 u， 将 u 从 集合 2 中 移 到 集合 8 中 ; 

(3) 以 4 为 当前 顶点 ,修改 2 中 与 x 相连 的 顶点 的 距离 。 修 改 的 方法 是 : 对 于 集合 O 中 每 一 
个 与 相连 的 顶点 vi, 如果 从 起 点 s 经 w 到 的 v 距 离 dist[u] + Ww,v)) 的 值 小 于 当前 v 的 距离 dist[vj] ， 
则 将 dist[wj] 的 值 修正 为 dist[u] + Ww, vi) 的 值 ， 同 时 将 顶点 六 的 前 驱 顶 点 记 为 u; 

(4) 重复 步骤 (2) 和 (3)， 直 到 集合 2 为 空 。 


回溯 每 条 最 短路 径 的 顶点 连接 关系 。 根 据 以 上 分 析 ，Dijkstra 算法 的 实现 如 下 : 


void Dijkstra(DIJKSTRA_GRAPH *graph) 


{ 
std::set<int> S,0; 


for(int i = 0; i < graph->nodes.size(); i++) 
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{ 
graph->dist[i] = graph->adj[graph->sourcel][i]; 
graph->prev[i] = (graph->dist[i] == MAX DISTANCE) ? -1 : graph->source; 
Q.insert(i); 

} 


graph->dist[graph->source] = 0; 


while(!0.empty()) 


{ 
int u = Extract Min(graph, ©); 
S.insert(u); 
for(auto it = 0Q.begin(); it != 0.end(); ++it) 
{ 
int vy 
if((graph->adj[u][v] < MAX_DISTANCE) // 小 于 MAX_DISTANCE 表示 有 边 相 连 
&8 (graph->dist[u] + graph->adj[uj[v] < graph->dist[v])) 
graph->dist[v] = graph->dist[u] + graph->adj[u][v]; // 更 新 dist 
graph->prev[v] = u;  // 记 录 前 驱 顶 点 
} 
} 
} 

DIJKSTRA_GRAPH 数据 结构 的 定义 21.1 节 已 经 给 出 , dist 和 prev 两 个 属性 的 作用 就 是 记录 当前 
顶点 的 最 短 距离 和 当前 节点 在 最 短路 径 上 的 前 驱 节 点 。Dist[v] 表 示 编 号 为 v 的 顶点 与 源 点 的 最 小 
距离 ，prev[v] 存 放 的 是 v 在 这 条 最 短路 径 上 的 前 驱 节 点 ， 逐 次 遍历 prev[v] 直 到 达到 源 点 ， 就 能 
依次 得 到 这 条 最 短路 径 上 的 每 个 顶点 ，21.2.3 节 的 UpdateCellInfo() 消 数 就 展示 了 通过 prev[v] 逐 
次 得 到 最 短路 径 的 方法 。Extract_Min() 函 数 从 集合 2 中 找到 dist 值 最 小 的 一 个 顶点 , 从 集合 2 中 
删除 这 个 顶点 并 返回 这 个 顶点 。Extract_Min() 函 数 的 实现 非常 简单 ， 大 家 可 以 从 本 章 的 随 书 代码 


中 找到 它 的 代码 。 
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21.2.2 节 给 出 的 算法 结束 后 , 集合 5S 中 是 所 有 搜索 过 的 项 点, 通过 UpdateCellInfo() 函数 将 其 


转换 成 GRID_CELL 数据 结构 ， 就 可 以 将 Dijkstra 算 法 的 结果 直观 地 展示 出 来 。 图 21-1 是 在 地 图 上 


没有 障碍 物 的 情况 下 Dijkstra 算 法 的 寻 径 结果 ， 可 以 明显 地 看 到 广度 优先 搜索 的 过 程 ， 


从 源 点 开 


始 向 外 层 层 搜索 ， 直 到 “ 碰 到 ”终点 为 止 。 根据 算法 原理 ， 有 灰色 辆 点 标识 的 小 方块 
到 目标 点 的 最 短路 径 。 


void UpdateCellInfo(DIJKSTRA GRAPH *graph，std::set<int>& S, GRID CELL *gc) 
二 


for(auto it = S.begin(); it != S.end(); ++it) 
{ 
GNODE node = graph->nodes[*it]; 
gc->cell[node.il][node.j].processed = true; 


} 


t 是 从 源 点 


334 了 第 21 章 AYx 寻 径 算法 


int u = graph->target; 

while(u != -1) 

{ 
GNODE node = graph->nodes[u]; 
gc->cell[node.i][node.j].inpath = true; 
u = graph->prev[ul]; 


} 
加 
一 算法 选择 
个 Dikstra 算 法 
三 A= 算 法 


厂 使 用 障碍 物 

-Ar 算法 距离 评估 -| 
| | 6 无 焉 高 评估 函数 
个 曼哈顿 距离 

个 欧 几 里 得 距离 

个 切 比 雪夫 距离 


图 21-1 Dijkstra 算 法 搜索 效率 图 示 (无 障碍 物 的 情况 ) 


那么 ， 有 障碍 物 的 情况 下 Dijkstra 算法 的 搜索 效率 如 何 呢 ? 我 们 在 地 图 中 加 入 一 段 墙 组 成 的 
障碍 物 〈 深 灰 色 方块 组 成 的 工 形 障碍 物 )，Dijkstra 算法 的 结果 显示 如 图 21-2 所 示 ， 几 乎 搜 遍 了 
整个 地 图 中 的 所 有 点 ， 但 是 找到 的 路 径 确 实 就 是 最 短路 径 。 


FT Xx| 


「 算法 选择 

合 Dikstra 算 法 

售 A* 算 法 
克 使 用 障碍 物 
FA* 算 法 距离 评估 一 一 
售 无 距离 评估 函数 
个 县 哈 顿 距离 
六 欧 几 里 得 距离 
三 切 比 雪夫 距离 


图 21-2 Dijkstra 算 法 搜索 效率 图 示 (有 障碍 物 的 情况 ) 
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21.3” 带 启发 的 搜索 算法 一 一 A* 算 法 


Dijkstra 算法 从 带 权 有 向 图 的 角度 寻找 图 中 顶点 之 间 的 最 短路 径 ， 只 是 简单 地 做 广度 优先 搜 
索 ,， 忽视 了 许多 有 用 的 信息 。 盲目 搜索 的 效率 很 低 ， 耗费 很 多 时 间 和 空间 。 考 虑 到 实际 地 图 上 的 
两 个 点 之 间 存 在 的 位 置 和 距离 信息 ， 是 否 可 以 利用 这 些 信息 得 到 一 种 高 效 的 寻 径 算法 呢 ? 很 显 
然 , 我 们 需要 一 种 启发 式 搜索 算法 。 一 提 到 启发 式 搜索 ,首先 要 想到 的 就 是 启发 函数 ,也 就 是 评 
佑 函数 。 评 估 函 数 的 作用 就 是 根据 起 点 和 终点 的 位 置 和 距离 信息 给 出 下 一 步 需要 搜索 各 个 位 置 的 
评估 值 ， 启 发 式 搜索 算法 可 以 有 以 下 三 种 方式 利用 这 些 评估 值 。 

口 根据 评估 结果 ， 每 次 选择 评估 值 最 高 的 位 置 开始 下 一 步 搜索 ， 避 免 言 目 的 穷 举 搜索 ; 

口 决定 搜索 的 顺序 ， 按 照 评估 值 的 高 低 排序 ， 从 评估 值 最 高 的 位 置 开 始 下 一 步 搜索 ( 如果 
评估 值 高 的 位 置 没 找到 结果 ， 则 评估 值 较 低 的 位 置 也 能 被 顺序 处 理 到 ); 

口 剪 枝 ， 去 除 一 些 明显 不 可 能 得 到 最 优 结果 的 搜索 位 置 ， 提 高 搜索 效率 。 


对 盲目 的 穷 举 搜索 来 说 ,启发 式 搜索 显然 更 高 效 , 但 是 如 果 评 佑 函数 选择 不 当 , 也 存在 得 不 
到 正确 结果 的 风险 。 

寻 径 算法 中 常见 的 启发 式 搜索 算法 有 BFS ( Best-First Search ) 搜索 算法 和 A* 算 法 。BFS 算 
法 是 在 广度 优先 搜索 算法 的 基础 上 加 入 评估 函数 , 通过 评估 函数 剪 枝 , 避免 一 些 明显 不 可 能 得 到 
最 短路 径 的 搜索 动作 。 在 没有 障碍 物 的 地 图 上 , 其 算法 效果 接近 A* 算 法 ,总 体 上 和 远 远 优 于 Dijkstra 
算法 。 但 是 BFS 算法 因为 评价 函数 只 考虑 位 置 方向 信息 ， 基 于 贪心 策略 ， 总 是 试图 向 最 接近 目 
标点 的 方向 移动 , 使 得 这 种 算法 在 有 障碍 物 的 地 图 上 表现 不 佳 , 很 多 情况 下 得 到 的 路 径 都 不 是 最 
短路 径 。 图 21-3 就 是 用 A* 算 法 模拟 的 BFS 算法 在 有 障碍 物 地 图 上 得 到 的 效果 ,由 于 过 于 强调 与 
终点 的 距离 ,使 得 算法 在 启发 函数 的 引导 下 一 路 向 右 ， 直 到 磁 到 障碍 物 才 转 向 , 这 显然 不 是 最 短 
路 径 。 


J 使 用 障碍 物 
A* 算 法 距离 评估 一 一 
全 无 距离 评估 函数 
合 曼哈顿 距离 

从 欧 几 里 得 距离 
三 切 比 雪夫 距离 


图 21-3 ”BFS 算法 在 有 障碍 物 的 情况 下 的 表现 
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A* 算 法 既 能 像 Dijkstra 算法 那样 搜索 到 最 短路 径 , 又 能 像 BFS 算 法 一 样 使 用 启发 函数 进行 启 
发 式 搜索 ,是 目前 各 种 寻 径 算法 中 最 受 欢 迎 的 选择 。 即 使 在 有 障碍 物 的 情况 下， 选择 合适 的 距离 
评估 函数 ，A* 算 法 基本 上 都 能 搜索 到 最 短路 径 。 本 节 我 们 将 介绍 A* 算 法 ， 其 中 启发 函数 的 距离 
评估 算法 分 别 采用 曼哈顿 距离 、 欧 氏 几 何平 面 距 离 和 切 比 雪夫 距离 ， 寻 径 算 法 演示 程序 会 以 图 示 
的 方式 给 出 它们 的 差别 。 


21.3.1 人 A* 算 法 原理 


BFS 算法 在 有 障碍 物 的 情况 下 会 失败 ,原因 在 于 其 评估 函数 只 考虑 当前 点 与 终点 的 距离 ,其 
策略 是 选择 与 终点 最 近 的 点 进行 搜索 。Dijkstra 算法 则 只 关注 当前 点 与 起 点 的 距离 ， 其 策略 是 选 
择 与 起 点 最 近 的 点 开始 搜索 ( 与 起 点 最 近 意 味 着 从 起 点 到 当前 点 是 最 短路 径 , 一 旦 当前 点 就 是 终 
点 , 那 自 然 就 是 到 终点 的 最 短路 径 ). 那么 将 二 者 结合 起 来 会 如 何 呢 ? 这 就 是 A* 算 法 的 启发 原理 。 

A* 算 法 的 启发 函数 采用 的 计算 公式 是 : F(n)= G(OO+ 瑟 0。FD 就 是 A* 算 法 对 每 个 点 的 评估 
函数 ， 它 包含 以 下 两 部 分 信息 。 

口 G(n) 是 从 起 点 到 当前 节点 n 的 实际 代价 ， 也 就 是 从 起 点 到 当前 节点 的 移动 距离 。 相 邻 的 

两 个 点 的 移动 距离 是 1， 当前 点 距离 起 点 越 远 ， 这 个 值 就 越 大 。 

口 Hn) 是 从 当前 节点 n 到 终点 的 距离 评估 值 。 这 是 一 个 从 当前 节点 到 终点 的 移动 距离 的 估 
计 值 。 

在 这 个 计算 公式 中 ， 如 果 我 们 设 G(n) 的 值 总 是 0， 则 算法 的 效果 类 似 于 BFS 算法 。 图 21-3 
所 示 的 结果 就 是 将 A* 算 法 中 的 GOD) 始终 赋值 为 0 得 到 的 效果 ,与 BFS 算法 的 结果 比较 相似 。 反 
过 来 ， 如 果 设 H(n) 的 值 总 是 0， 则 算法 可 退化 得 到 类 似 Dijkstra 算法 的 效果 ， 如 图 21-4 所 示 。 


克 使 用 障碍 物 
A 算法 距离 评估 一 一 
售 无 距离 评估 函数 
个 曼哈顿 距离 
三 欧 几 里 得 距离 
售 切 比 雪夫 距离 


21-4 A* 算 法 退化 为 Dijkstra 算 法 的 效果 


A* 算 法 的 搜索 过 程 需要 两 个 表 ， 一 个 是 OPEN 表 ， 存 放 当 前 已 经 被 发 现 但 是 还 没有 搜索 过 
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的 节点 。 另 一 个 是 CLOSE 表 ， 存 放 已 经 搜索 过 的 节点 。A* 算 法 通过 以 下 步骤 搜索 最 短路 径 。 

(1) 初始 化 OPEN 表 和 CLOSE 表 ， 将 起 点 加 入 到 OPEN 表 中 ; 

(2) 从 OPEN 表 中 取出 当前 F(n) 值 最 小 的 节点 作为 当前 搜索 节点 U, 将 U 节 点 加 入 到 CLOSE 
表 中 ; 

(3) 对 于 每 一 个 与 U 可 连通 的 节点 (障碍 物 不 相通 ) 玉 考察 天 

如 果 7 已 经 在 CLOSE 表 中 ， 则 对 该 节点 不 做 任何 处 理 ; 

如 果 天 不 在 OPEN 表 中 , 则 计算 瓦 门 , 将 的 前 驱 节 点 设置 为 U 并 将 VV 加 入 到 OPEN 表 中 ; 

如 果 在 OPEN 表 中 ， 比 较 G(OJ+ 1 与 G( 内 的 大 小 〈( 态 内 的 值 是 不 变 的 )， 如 果 G(ODJ +1< 
G( 胞 ， 则 令 G( 用 = G(W) +1， 同 时 将 的 前 驱 节 点 设置 为 U; 

重复 步 又 (2) 和 (3)， 直 到 第 (2) 步 得 到 的 搜索 节点 上 就 是 终点 为 止 ， 此 时 算法 结 


21.3.2 ”常用 的 距离 评估 函数 


Me ae a i A* 算 法 需要 一 个 距离 评估 函数 来 计算 这 个 值 。 有 很 多 距离 评 
佑 函数 可 供 选 择 ， 本 节 介 绍 曼哈顿 距离 、 欧 氏 几 何平 面 距离 和 切 比 雪夫 距离 。 在 没有 障碍 物 的 地 
图 上 ， 2 如 图 21-5 所 示 。 但 是 在 有 障碍 物 的 地 图 上 ， 
三 种 距离 评估 函数 的 效果 略 有 差异 。 特 别 地 ， 如 果 距 离 评估 函数 总 是 返回 0， 则 可 令 A* 算 法 退 
化 为 Dijkstra 算法 的 效果 ， 在 图 21-4 中 我 们 已 经 看 到 了 这 种 效果 。 


| 上 寻 征 算 法 对 比 演示 程 订 22 Xx| 
-算法 选择 
国 国 四 因 | 国 国 本 本 四 匡 本 | 本国 四 男 本 | | sayt 
转 国 图 图 图 图 国 国 国 国 国 转 国 国 图 本 
轩 | 画 | 图 | 回 | 加 | 加 | 加 | 加 | 二 | 可 | 加 | 加 | 加 | 可 | 加 | 国 || 2 人 区 寺 
图 加 本 图 图 

厂 使 用 障碍 物 
A- 算法 耻 离 评估 一 
个 无 本 评估 函数 
个 县 哈 顿 高 
他 欧 几 里 得 距离 
个 切 比 雪夫 距离 


图 21-5 在 没有 障碍 物 的 情况 下 ， 欧 几 里 得 距离 评估 函数 的 效果 


1. 曼哈顿 距离 
曼哈顿 距离 (Manhattan distance ) 是 19 世纪 的 赫 尔 曼 ' 闵可夫 斯 基 所 创 的 词语 ， 曼 哈 顿 距 
离 的 命名 原因 是 从 规划 为 方 型 建筑 区 块 的 城市 ( 如 曼哈顿 ) 中 寻找 最 短 行车 路 径 问 题 所 引入 的 命 
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名 , 所 以 它 又 被 称 为 出 租车 几何 距离 。 从 数学 上 摘 述 曼哈顿 距离 是 两 个 点 在 各 个 坐标 轴 上 的 距离 
差 值 的 总 和 ，n 维 几 何 空间 中 的 曼哈顿 距离 的 数学 描述 为 : 


Danpattan (p,9)= 站 (px; qx;) 


对 于 二 维 平 面 上 的 两 个 点 CcuyD 和 Co, 2)， 其 曼哈顿 距离 就 是 : 
D= [eq —x,)|+|y -yy| 
即 欧 氏 几何 平面 距离 在 直角 坐标 系 中 两 个 坐标 轴 上 的 投影 的 距离 之 和 。 本 章 介 绍 A* 算 法 用 的 曼 
哈 顿 距离 实现 代码 是 : 
double ManhattanDistance(const ANODE& n1, const ANODE& n2) 


{ 
return (std::abs(n1.i - n2.i) + std::abs(n1.j - n2.j)); 
} 
在 有 障碍 物 的 地 图 上 ， 使 用 曼哈顿 距离 评估 函数 的 A* 算 法 效果 如 图 21-6 所 示 。 


上 遍 寻 径 算法 对 比 演示 程序 x| 
算法 选择 

国 本 加 国 梧 国 国 王国 国 本 可 可 本 国 司 | 。 

草图 曙 桓 尖 加 因 下 面 区 四 加 豆 四 区 所 | 和 

e A=+ 算 ; 


克 使 用 障碍 物 
| | -A* 算 法 距离 评估 一 一 
个 无 距离 评估 函数 
他 曼哈顿 距离 
个 欧 几 里 得 距离 
个 切 比 雪夫 距离 


图 21-6 使 用 曼哈顿 距离 的 A* 算 法 效果 


2. 欧 氏 几何 平面 距离 


欧 氏 几何 平面 距离 (Euclidean distance ) 又 称 为 欧 氏 距离 或 欧 几 里 得 距离 ， 它 的 数学 定义 是 
n 维 空间 中 两 个 点 之 间 的 真实 距离 ( 几何 距离 )， 其 数学 符号 可 描述 为 : 


Dauuiaen(P,9) = A 之 (px; 一 qx,) 
局 


对 于 二 维 平面 上 的 两 个 点 (i, 7 和 (Co, 2)， 其 欧 氏 几何 平面 距离 就 是 : 
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D= Va —xs) + (7 -yy,) 

即 平面 几何 中 两 点 之 间 的 几何 距离 。 本 章 介绍 A* 算 法 用 的 欧 氏 几何 平面 距离 实现 代码 是 : 

double EuclideanDistance(const ANODE& n1, const ANODE& n2) 

return std::sqrt(double(n1.i - n2.i)*(n1.i - n2.i) + (n1.j - n2.j)*(n1.j - n2.j)); 

} 

在 有 障碍 物 的 地 图 上 ,使 用 欧 氏 几何 平面 距离 评估 函数 的 A* 算 法 效果 如 图 21-7 所 示 。 可 以 
看 到 与 Dijkstra 算法 得 到 的 最 短路 径 稍 有 差别 ， 这 是 因为 欧 氏 几何 平面 距离 强调 对 角 线 方向 上 的 
距离 , 但 是 我 们 的 演示 程序 只 在 一 个 顶点 的 上 下 左右 四 个 方向 视 为 联通 方向 ,对 角 线 方向 相 邻 的 
节点 不 是 联通 节点 ， 所 以 最 后 一 段 变 成 了 折线 。 后 面 我 们 将 介绍 距离 评估 取 数 Hn) 与 A* 算 法 的 
关系 。 


ET x| 
一 算法 选择 
| 。 
四 图 图 加 图 国 图 图 区 同 轩 贺 加 
图 国画 图 图 图 


售 A* 算 法 


图 图 
图 | | | | | 全 用 障 看 物 


| | -A* 算 法 距离 评估 一 一 
个 无 距离 评估 函数 
个 曼哈顿 距离 

会 欧 几 里 得 距离 
个 切 比 雪夫 距离 


图 21-7 使 用 欧 氏 几何 平面 距离 的 A* 算 法 效果 


3. 切 比 雪夫 距离 

切 比 雪夫 距离 (Chebyshev distance ) 是 由 一 致 范 数 (uniform norm ) (或 称 为 上 确 界 范 数 ) 所 | 
衍生 的 度量 ， 从 数学 上 理解 ， 对 于 两 个 向 量 p 和 gqg， 其 切 比 雪夫 距离 就 是 向 量 中 各 个 分 量 的 差 的 
绝对 值 中 最 大 的 那 一 个 ， 用 数学 符号 可 描述 为 : 


Denevyshev (p,q9)= max(|p, 一 硝 ) 
特别 情况 下 ， 对 于 二 维 平 面 上 的 两 个 点 Ce 0 和 (ce, 加)， 其 切 比 雪夫 距离 就 是 : 


? 


J 2 ) 
即 两 个 点 之 间 的 切 比 雪夫 距离 就 是 两 个 方向 上 坐标 数值 差 的 最 大 值 。 本 章 介 绍 A* 算 法 用 的 切 比 
雪夫 距离 实现 代码 是 : 


D= max(|x = 
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double ChebyshevDistance(const ANODE8& n1，const ANODE& n2) 


return std::max<double>(std::abs(n1.i - n2.i), std::abs(n1.j - n2.j)); 


在 有 障碍 物 的 地 图 上 ,使 用 欧 氏 几何 平面 距离 评估 也 数 的 A* 算 法 效果 如 图 21-8 所 示 。 


Xx| 

-算法 浊 择 
人 Dijkstra 算法 
G Ar= 算 法 


人 Y 使 用 障碍 物 
A* 算 法 距离 评估 一 一 
全 无 距离 评估 函数 
全 曼哈顿 距离 

全 欧 几 里 得 距离 
从 切 比 雪夫 距离 


图 21-8 使 用 切 比 雪夫 距离 的 A* 算 法 效果 

4. H(n) 与 A* 算 法 的 关系 

距离 评估 函数 H(n) 与 A* 算 法 的 结果 之 间 存 在 很 微妙 的 关系 ， 前 面 介绍 过 ， 如 果 令 H(n) 始 终 
为 0， 相当 于 一 点 启发 信息 都 没有 ， 则 A* 算 法 退化 为 Dijkstra 算法 ， 这 种 情况 被 称 为 最 差 的 A* 
算法 ( 尽管 如 此 ， 可 以 确保 得 到 最 短路 径 )。、H(n) 的 值 越 小 ， 启 发 信息 越 少 ， 搜 索 范 围 越 大 ， 速 
度 越 慢 ， 但 是 越 有 希望 得 到 最 短路 径 。H(n) 值 越 大 ， 启 发 信息 越 多 ， 搜 索 范 围 越 小 ， 速 度 越 快 ， 
但 是 有 可 能 得 不 到 真正 的 最 短路 径 。 当 Hn) 大 到 一 定 程度 ,，F(n) 公 式 中 G(n) 的 值 可 以 被 忽略 ， 则 
A* 算 法 演化 成 BFS 算法 ， 速 度 最 快 ， 但 是 不 一 定 能 得 到 最 短路 径 。 

这 是 一 个 很 有 意思 的 关系 ，A* 是 一 个 很 灵活 的 算法 ， 通 过 调整 G(n) 和 H(n) 函 数 ， 可 以 使 得 
A* 算 法 在 速度 和 准确 性 之 间 获 得 一 个 折 中 的 效果 。 在 很 多 情况 下 ， 让 游戏 中 的 人 物 沿 着 一 条 近 
似 最 短 的 路 径 到 达 目 的 地 就 可 以 了 ， 不 一 定 要 走 最 短路 径 。 


21.3.3 ”A* 算 法 实现 


A* 算 法 实现 的 关键 是 维护 OPEN 表 和 CLOSE 表 , 其 中 对 OPEN 表 的 主要 操作 就 是 查询 F(n) 
最 小 的 节点 和 删除 节点 ， 因 此 我 们 考虑 在 算法 实现 时 将 OPEN 设计 为 有 序 表 。STL 中 的 multiset 
天 然 具 有 排序 特征 ,因此 我 们 考虑 使 用 std: :multiset 表达 OPEN 表 。AStar() 孙 数 是 A* 算 法 的 实 
现 ， 从 注释 可 以 看 到 与 21.3.1 节 介 绍 的 A* 算 法 三 个 步 又 一 一 对 应 。ExtractMiniFrom0pen() 函 数 从 
OPEN 表 中 取出 F(n) 值 最 小 的 一 个 节点 ，OPEN 表 已 经 根据 F(n) 的 值 从 低 到 高 排序 ， 因 此 
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ExtractMiniFrom0pen() 函 数 所 做 的 事情 就 是 从 OPEN 表 中 取出 第 一 个 节点 。 


void AStar(ASTAR_GRAPH *graph, GRID CELL *gc) 


// 步 又 (1) 
graph->open.insert(graph->source); 


// 步 骤 (2) 
ANODE cur node; 
while(ExtractMiniFromOpen(graph, cur_node)) 


{ 
graph->close.push back(cur_ node); 
if(cur node == graph->target) 
{ 
UpdateCellInfo(graph, gc); 
break; 
} 
// 步 骤 (3) 
for(int d = 0; d COUNT OF(dir); d++) 
{ 
ANODE nn = {cur node.i + dir[d].y, cur node.j + dir[d].x, 0, 0}; 
if((nn.i >=0) 8& (nn.i < N SCALE) 8& (nn.j >=0) 8&& (nn.j < N_SCALE) 
&8 (gc->cell[nn.il][nn.j].type != CELL WALL) 
8& lIsNodeExistInClose(graph->close, nn.i, nn.j)) 
{ 
std: :multiset<ANODE, compare>::iterator it; 
it = find(graph->open.begin(), graph->open.end(), nn); 
if(it == graph->open.end()) /*nn 不 在 open 列表 */ 
{ 
nn.g = Cur_node.g + 1; // 将 g 始终 赋值 为 可 得 到 BFS 算法 的 效果 
nn.h = ManhattanDistance(nn, graph->target); 
nn.prev i = cur node.i; 
nn.prev j = cur node.j; 
graph->open.insert (nn); 
gc->cell[nn.il][nn.j].processed = true; 
} 
else /*nn 在 open 列表 中 */ 
{ 
if((cur node.g + 1.0) < it->g) 
{ 
it->g = cur node.g + 1.0) 
it->prev i = cur node.i; 
it->prev j = cur node.j; 
} 
} 
} 
} 
} 


} 
这 就 是 A* 算 法 的 实现 ， 并 不 像 它 的 名 字 那 么 神秘 ， 正 如 广告 说 的 那样 : 简约 而 不 简单 。A* 
算法 是 各 种 游戏 中 最 常用 也 是 最 好 的 寻 径 算法 之 一 。 
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21.4 总结 


从 Dijkstra 算法 和 Ax* 算 法 的 实现 可 知 ， 它 们 都 是 很 简单 的 算法 。Dijkstra 算法 的 时 间 复 杂 度 


快 的 单 源 最 短路 径 算法 。 如 果 


A* 算 法 兼 有 Dijkstra 算法 


是 O(n”), 其 中 是 有 向 图 中 顶点 的 个 数 。 对 于 不 含 负 权 边 的 有 向 图 来 说 ，Dijkstra 算 法 是 目前 最 


有 向 图 中 含有 负 权 的 边 ， 则 可 以 使 用 Floyd-Warshall 算法 求解 最 短 


路 径 。Floyd-Warshall 算法 可 以 求解 有 向 图 中 任意 两 点 之 间 的 最 短 距 离 ， 其 时 间 复 杂 度 是 O(n )。 


和 BFS 算 法 的 特点 , 在 速度 和 准确 性 之 间 具 有 很 大 的 灵活 性 。 除了 


调整 G(n) 和 五 0) 获得 不 同 效 曙 


RR，A* 算 法 还 有 很 多 提高 效率 的 改进 算法 。 比 如 在 地 图 很 大 的 情况 


下 , 可 以 使 用 二 叉 堆 来 维护 OPEN 表 以 获得 更 好 的 效率 。 对 于 环境 和 权重 都 不 断 发 生变 化 的 动态 
网 络 ， 还 有 动态 A* 算 法 (又 称 D* 算 法 )。 


Dijkstra 算法 在 地 图 和 导航 软件 中 得 到 了 广泛 的 应 用 ，A* 算 法 在 游戏 软件 中 也 得 到 了 广泛 的 


应 用 , 它们 都 是 很 简单 的 算法 , 但 是 却 得 到 了 广泛 的 应 用 , 这 也 是 小 算法 解决 大 问题 的 现实 例子 。 
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第 少 少 章 
俄罗斯 方块 游戏 


俄罗斯 方块 游戏 ( Tetris ) 是 前 苏联 科学 家 阿 列 
克 谢 : 帕 基 特 诺 夫 在 1984 年 6 月 利用 空闲 时 间 所 编 
写 的 一 个 游戏 程序 ( 如 图 22-1 所 示 )。 帕 基 特 诺 夫 当 
时 是 俄罗斯 科学 院 计算 机 中 心 工作 的 数学 家 ,据说 他 
编写 这 个 游戏 最 初 的 目的 是 用 来 测试 一 种 新 型 计算 
机 的 性 能 。 至 于 这 个 游戏 名 字 的 来 历 , 据说 是 因为 帕 
基 特 诺 夫 喜欢 网 球 (Tennis ) 运动 ， 于 是 他 把 来 源 于 
希腊 语 的 tetra ( 意 为 “四 ”) 与 其 结合 , 造 了 “tetris” 
一 词 ， 不 过 这 个 说 法 也 未 经 证 实 。 从 1988 年 开始 ， 
俄罗斯 方块 游戏 风靡 全 世界 .从 最 初 的 街机 和 掌上 游 
戏 机 到 计算 机 平台 , 再 到 现在 的 手机 、 平 板 等 移动 平 
台 ， 它 深 受 全 世界 游戏 迷 的 喜爱 。 图 22-1 俄罗斯 方块 游戏 

编写 一 个 俄罗斯 方块 游戏 ， 涉 及 键盘 控制 、 定 时 器 、UI 和 复杂 数据 结构 定义 和 使 用 ， 非 常 
具有 挑战 性 , 很 多 编程 爱好 者 都 自己 编写 过 俄罗斯 方块 游戏 。 但 是 大 家 有 没有 想 过 ， 是否 可 以 脱 
离 人 的 控制 , 让 计算 机 自己 玩 俄罗斯 方块 游戏 呢 ? 事实 上 , 很 多 高 级 的 俄罗斯 方块 游戏 都 提供 了 
电脑 演示 或 电脑 提示 的 功能 ， 那 么 ， 如 何 让 计算 机 知道 把 各 种 形状 的 板块 放 在 最 合适 的 位 置 上 
呢 ? 本 章 我 们 就 来 介绍 一 种 简单 的 人 工 智能 (AI ) 算法 ,让 计算 机 玩 俄罗斯 方块 游戏 。 这 类 简单 
的 人 工 智 能 的 本 质 就 是 通过 评估 函数 ,对 一 个 局 面 以 及 局 面 的 演化 结果 进行 评估 , 选择 较 好 的 一 
个 局 面 作为 演化 结果 。 类 似 的 算法 还 被 用 在 棋 类 游戏 中 ,第 23 章 将 会 介绍 此 类 人 工 智能 算法 在 
棋 类 游戏 中 的 应 用 。 


22.1 俄罗斯 方块 游戏 规则 


俄罗斯 方块 游戏 一 共有 七 种 形状 不 同 的 板块 ， 每 种 板块 都 由 四 个 小 方块 组 成 ， 如 网 22-2 所 
示 ， 这 些 板块 被 冠 以 一 个 大 写 英 文字 母 作 为 名 字 ， 分 别 是 : I、J、L、0O、S、T 和 Z。 游 戏 的 区 
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域 是 一 个 宽度 为 10 个 小 方块 、 高 度 为 20 个 小 方块 的 长 方形 区 域 。 在 游戏 进行 的 过 程 中 , 不 同形 
状 的 板块 从 游戏 区 域 上 方 随机 落下 , 在 板块 下 落 的 过 程 中 , 玩家 可 以 通过 游戏 机 的 控制 按钮 ， 以 
90 度 为 单位 顺 时 针 或 逆 时 针 旋转 板块 ， 同 时 也 可 以 左右 移动 板块 。 当 一 个 板块 下 沙 到 游戏 区 域 
最 下 方 或 着 落 到 其 他 板块 上 无 法 再 向 下 移动 时 , 就 会 固定 在 该 处 , 然后 新 的 板块 从 游戏 区 域 的 上 
方 开始 落下 。 当 区 域 中 某 一 横行 的 小 方 格 全 部 由 方块 十 满 时 , 则 该 行 会 被 消除 并 成 为 玩家 的 得 分 。 
同时 消除 的 行 数 越 多 ， 得 分 也 越 多 ， 比 如 消除 一 行 得 100 分 ， 同 时 消除 两 行 可 以 得 200 分 ， 同 时 
消除 三 行 可 以 得 400 分 ， 同 时 消除 四 行 可 以 得 800 分 。 没 有 被 消除 掉 的 方块 不 断 堆 积 起 来 , 一旦 
堆 到 游戏 区 域 项 端 ， 玩 家 便 告 输 ， 游 戏 结束 。 


是 


(S) OD (2) 


图 22-2 ”俄罗斯 方块 形状 示意 图 


一 般 来 说 ,游戏 还 会 提示 下 一 个 将 要 落下 的 板块 的 形状 , 熟练 的 玩家 会 利用 下 一 个 板块 的 形 
状 评估 现在 要 如 何 摆 放 当前 的 板块 。 玩 家 玩 俄罗斯 方块 游戏 的 目的 是 得 更 高 的 分 数 和 玩 更 长 的 时 
间 , 但 是 游戏 能 不 断 进行 下 去 对 商用 游戏 不 太 合适 ,所 以 一 般 俄罗斯 方块 游戏 的 程序 设计 都 会 随 
着 游戏 的 进行 而 提高 难度 ， 比 如 加 快板 块 的 下 落 速 度 ， 随 机 增加 一 些 带 空格 的 行 等 。 

俄罗斯 方块 游戏 在 传播 过 程 中 ， 出 现 了 很 多 有 意思 的 改版 ， 有 的 是 增加 了 更 多 形状 的 板块 ， 
有 的 是 增加 一 种 能 穿 透 固定 方块 的 单 格 小 方块 , 使 得 玩家 能 够 有 机 会 “ 补 上 ”游戏 区 域 下 方 的 “ 空 
洞 "。 还 有 2.5 维和 3 维 俄罗斯 方块 游戏 , 以 及 利用 整 面 墙 上 的 窗户 模拟 俄罗斯 方块 游戏 的 有 趣 斌 
验 ， 大 家 可 以 在 本 章 的 参考 资料 外 中 了 解 到 这 些 内 容 。 本 章 介绍 的 智能 算法 都 是 基于 标准 俄罗斯 
方块 游戏 的 规则 设计 的 ， 可 能 不 适用 于 各 种 改版 游戏 规则 ,但 是 作为 一 种 基础 方法 ,读者 可 以 在 
此 基础 上 增加 对 其 他 规则 的 支持 。 


22.2 ”俄罗斯 方块 游戏 人 工 智能 的 算法 原理 


在 探讨 计算 机 的 俄罗斯 方块 游戏 智能 算法 之 前 , 我 们 先 研 究 一 下 人 类 玩家 玩 这 个 游戏 的 一 些 
基本 策略 。 玩 家 玩 这 个 游戏 ， 首 先 要 能 够 玩 尽 量 长 的 时 间 ， 这 就 要 求 要 尽 可 能 地 消除 行 ， 避免 累 
只 高 度 太 高 。 其 次 是 尽量 多 的 得 分 利用 规则 消除 加 分 的 特点 ,尽量 一 次 消除 多 行 。 在 遇 到 板块 
形状 很 难处 理 的 情况 ， 要 选择 产生 空格 子 少 的 摆 放 方法 ， 尽 量 避 免 出 现 “ 空 洞 "。 很 多 情况 下 ， 
当 一 个 板块 可 以 摆 放 在 多 个 位 置 的 时 候 , 玩家 需要 根据 自己 的 经 验 选 择 一 个 对 下 一 步 操 作 最 有 利 
的 位 置 摆 放 这 个 板块 ， 这 就 涉及 局 面 评估 的 问题 。 
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玩家 可 以 根据 自己 的 经 验 迅 速 做 出 判断 ， 但 是 计算 机 做 不 到 这 一 点 。 使 用 神经 网 络 + 专家 系 
统 可 以 使 计算 机 具有 一 点 “经 验 ”， 但 是 对 于 俄罗斯 方块 这 样 的 游戏 有 点 大 材 小 用 。 对 于 此 类 问 
题 , 通常 的 做 法 是 设计 一 个 局 面 评价 函数 ， 对 各 种 可 能 的 局 面 进 行 评估 , 根据 评估 结果 选 出 最 好 
的 一 个 局 面 进行 实施 。 对 于 俄罗斯 方块 游戏 而 言 ， 我 们 把 10 x 20 个 小 格子 组 成 的 游戏 区 域 称 作 
一 个 “棋盘 ”， 所 谓 的 局 面 就 是 一 个 板块 摆 放 在 茶 个 位 置 后 这 个 “棋盘 ”的 状态 。 如 果 一 个 板块 
有 多 个 位 置 可 以 摆 放 ， 就 会 产生 多 个 “棋盘 ”状态 ， 使 用 评价 函数 对 每 个 状态 进行 评估 ,根据 评 
估 的 结果 将 板块 摆 放 在 最 佳 位 置 上 。 


22.2.1 影响 评价 结果 的 因素 


影响 评价 结果 的 因素 是 多 方面 的 , 对 这 些 因素 需要 一 个 统一 的 考虑 ,选择 一 个 合理 的 评估 策 
略 。 每 一 个 板块 放 在 什么 位 置 ， 都 会 造成 一 系列 的 状态 参数 变化 ， 根 据 俄罗斯 方块 游戏 的 规则 ， 
我 们 整理 出 相关 的 参数 有 如 下 几 个 。 


口 当 一 个 板块 摆 放 后 ， 与 这 个 板块 相 接触 的 小 方块 的 数量 是 一 个 需要 考虑 的 参数 。 很 显然 ， 
与 之 接触 的 小 方块 越 多 ,说 明 这 个 板块 摆 放 在 该 位 置 后 产生 的 空格 或 “空洞 ” 越 少 ， 如 
果 一 个 “棋盘 ”局 面 中 空 的 小 方 格 或 “空洞 ”数量 少 则 说 明 这 个 局 面 对 玩 家 有 利 。 

口 当 一 个 板块 摆 放 在 某 个 位 置 后 ， 这 个 板块 最 高 点 的 高 度 是 一 个 需要 考虑 的 参数 。 这 个 高 
度 会 影响 整体 的 高 度 ， 当 有 两 个 位 置 可 选 则 摆 放 板块 时 ， 应 该 优先 选择 放置 在 板块 最 高 
点 的 高 度 比 较 低 的 位 置 上 。 

口 当 一 个 板块 摆 放 在 某 个 位 置 后 能 消除 的 行 数 是 一 个 重要 参数 。 毫 无 疑问 ， 能 消除 的 行 越 

多 越 好 。 

口 游戏 区 域 中 已 经 被 下 落 板块 填充 的 区 域 中 空 的 小 方 格 的 数量 也 是 评价 游戏 局 面 的 一 个 重 

要 参数 。 很 显然 ， 每 一 行 中 的 空 小 方 格 数量 越 多 ， 局 面 对 玩家 越 不 利 。 

口 游戏 区 域 中 已 经 被 下 落 板块 填充 的 区 域 中 “空洞 ”的 数量 也 是 一 个 重要 参数 。 如 果 一 个 
空 的 小 方 格 上 方 被 其 他 板块 的 小 方 格 挡住 ， 则 这 个 小 方 格 就 形成 “空洞 "。 “空洞 ”是 俄 
罗斯 方块 游戏 中 最 难处 理 的 情况 , 必需 等 上 层 的 小 方块 都 被 消除 后 才 有 可 能 填充 “空洞 ”。 
很 显然 ， 这 是 一 个 能 恶化 局 面 的 参数 。 

简单 地 理解 , 摆 放 一 个 板块 的 策略 就 是 : 板块 放置 的 位 置 越 靠 下 越 好 , 方块 之 间 越 紧密 越 好 ， 

能 消除 的 〈 行 ) 方块 数量 越 多 越 好 。 当 然 ， 这 些 参 数 要 统一 考虑 ， 片 面 地 突出 某 一 方面 的 参数 ， 

会 起 到 物 极 必 反 的 作用 。 举 个 例子 ,选择 摆 放 板块 的 位 置 时 ， 如 果 能 消除 一 行当 然 是 非常 理想 的 

位 置 ,但 是 如 果 评 估 函 数 过 分 重视 消除 参数 的 影响 ， 反 而 会 导致 一 些 非常 不 利 的 局 面 出 现 。 图 

22-3 就 展示 了 一 种 单方 面 突 出 消除 参数 而 导致 糟糕 局 面 的 情况 。 在 图 22-3a 所 示 的 局 面 上 扎 放 板 

块 J， 如 果 突 出 消除 参数 的 因素 ,评价 函数 最 终 的 结果 可 能 会 选择 图 22-3b 所 示 的 放置 位 置 ， 

为 这 样 能 消除 一 行 。 但 是 这 样 摆 放 的 结果 是 出 现 了 “空洞 ”， 这 是 俄罗斯 方块 游戏 中 最 坏 手 的 情 

况 。 事 实 上 ， 在 这 种 局 面 下 ， 对 玩家 最 有 利 的 摆 放 方法 是 放 在 图 22-3c 所 示 的 位 置 上 。 
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图 22-3 过 分 突出 消除 参数 而 导致 不 利 局 面 的 示例 


22.2.2 ”常用 的 俄罗斯 方块 游戏 人 工 智能 算法 


可 以 说 , 评估 函数 的 优 劣 决定 了 游戏 智能 的 强 弱 ， 这么 多 参数 中 ， 如 何 给 出 一 种 均衡 的 评估 
策略 , 使 得 评估 函数 总 是 能 够 给 出 最 有 利 的 评价 结果 ? 这 个 问题 不 好 回答 , 首先 要 根据 问题 的 本 
质 确定 这 些 参数 和 评估 结果 是 线性 关系 还 是 各 种 非 线 性 关系 , 其 次 是 确定 各 种 参数 在 评估 结果 曲 
线 上 的 系数 。 确 定 这 些 系数 没有 好 的 方法 ， 如 果 参 数 不 复 杂 ， 而 且 是 简单 的 线性 关系 ， 可 以 通过 
多 次 对 比 实践 逐步 调整 这 些 参数 的 系数 。 如 果 参 数 复杂 且 参 数 之 间 的 关系 复杂 , 多数 人 会 选择 使 
用 神经 网 络 之 类 的 学 习 算法 ， 利 用 大 量 的 游戏 局 面 数据 进行 “训练 ”"， 最终 收敛 出 一 组 能 接近 最 
优 结果 的 系数 。 但 是 这 种 方法 也 存在 随机 性 比较 大 的 问题 ， 受 “训练 ”数据 的 影响 比较 大 ， 如 果 
“训练 ”数据 不 够 多 ， 得 到 的 结果 会 非常 差 。 


幸运 的 是 , 我 们 不 需要 做 这 些 棘 手 的 事情 ,这 个 领域 的 先行 者 们 为 我 们 留 下 了 他 们 的 经 验 和 
研究 结果 。 最 初 人 们 热衷 于 研究 俄罗斯 方 块 游戏 的 ， 不 死 ” 算法， 也 有 一 些 人 开始 研究 怎么 打败 
俄罗斯 方块 游戏 的 AI 程序 。1997 年 , Heidi Burgiel 在 参考 资料 中 中 证 明了 完全 随机 的 俄罗斯 方块 
游戏 最 终 一 定 会 结束 ， 于 是 人 们 把 热情 转移 到 如 何 让 程序 的 AI 能 够 获得 更 高 的 积分 或 消除 更 多 
的 行 (平均 值 ), 在 这 个 过 程 中 出 现 了 很 多 著名 的 AI 算法 ,比如 Pierre Dellacherie 算 法 、Colin Fahey 
算法 、Roger LLima/Laurent Bercot/Sebastien Blondeel 算 法、James & Glen 算法 和 Thiery & Scherrer 
算法 等 。Colin Fahey 算法 和 James & Glen 算法 都 支持 two-piece 算 法， 所 谓 的 two-piece 算法 ,就 
是 在 评估 的 过 程 中 将 当前 板块 形状 和 下 一 块 板块 形状 一 起 进行 评估 和 计算 。Colin Fahey 在 自己 的 
网 站 上 公开 了 算法 的 实现 代码 ， 同 时 还 发 布 了 一 个 算法 模拟 平台 ， 各 种 俄罗斯 方块 游戏 的 AI 算 
法 可 以 在 这 个 平台 上 进行 对 比 和 评估 。 大 家 可 以 通过 参考 资料 中 给 出 的 链接 下 载 Colin Fahey 
的 实现 代码 和 这 个 模拟 平台 。 在 2003 年 之 前 ，Colin Fahey 算法 在 这 个 模拟 器 平台 上 取得 了 非常 
好 的 效果 。 

在 评估 过 程 中 只 考虑 当前 板块 形状 的 one-piece 算法 相对 简单 一 些 ,但 是 取得 的 效果 一 点 也 
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不 比 two-piece 算法 差 ， 甚 至 要 强 于 two-piece 算法 。Pierre Dellacherie 算法 和 Thiery & Scherrer 
算法 都 是 比较 著名 的 one-piece 算法 ,当然 ,James & Glen 算 法 有 one-piece 算法 的 版 本 .Colin Fahey 
算法 如 果 屏 蔽 对 下 一 板块 的 判断 ， 也 可 以 当成 one-piece 算法 ,但 是 由 于 Colin Fahey 算法 是 针对 
two-piece 的 情况 研究 的 算法 , 在 one-piece 的 情况 下 性 能 很 差 。 Christophe Thiery 和 Bruno Scherrer 
在 参考 资料 站 中 介绍 了 这 些 算法 的 评估 原理 和 评分 方法 。 当 然 ,Bruno Scherrer 和 Christophe Thiery 
两 人 也 发 布 了 Thiery & Scherrer 算法 的 实现 ( 毕 况 这 就 是 他 们 俩 研究 的 算法 嘛 )， 据 说 可 以 平均 
消除 3500 万 行 。2009 年 他 们 发 布 了 这 个 算法 的 1.4 版 , 立即 超越 Pierre Dellacherie 算法, 成 为 当 
年 one-piece 算 法 的 No.1， 大 家 可 以 通过 参考 资料 站 提供 的 链接 下 载 他 们 的 算法 实现 。 

本 章 我 们 将 重点 介绍 相对 简单 一 点 的 Pierre Dellacherie 算法 ， 该 算法 每 次 只 考虑 当前 板块 的 
情况 , 是 一 种 one-piece 算法 。Pierre Dellacherie 算法 虽然 简单 , 但 是 性 能 一 点 都 不 弱 , Colin Fahey 
在 他 的 网 站 上 非常 推崇 Pierre Dellacherie 算法 ， 称 其 是 one-piece 算法 中 最 好 的 算法 ( 2003 年 )。 
Pierre Dellacherie 算法 最 好 的 结果 是 能 消除 200 多 万 行 , 平均 也 能 达到 65 万 行 。 在 2003 年 , Pierre 
Dellacherie 算法 是 one-piece 算法 中 公认 的 No.1。 


22.2.3 ”Pierre Dellacherie 评估 算法 


22.2.1 节 介绍 了 一 些 评价 俄罗斯 方块 游戏 局 面 的 参数 ， 但 是 这 些 参数 都 是 一 些 抽象 的 参数 ， 
如 何 具体 使 用 这 些 参数 进行 评估 计算 呢 ? 对 于 这 些 参数 , 不 同 的 算法 有 不 同 的 使 用 策略 , 本 节 要 
介绍 的 Pierre Dellacherie 评估 算法 就 是 其 中 一 种 评价 策略 。2003 年 ， 法 国人 Pierre Dellacherie 在 
Colin Fahey 的 平台 上 提交 了 一 种 one-piece 算法 ， 该 算法 的 结果 超过 了 Colin Fahey 算法 ， 取 得 了 
平均 消除 65 万 行 的 成 绩 ， 成 为 2003 年 智能 程度 最 高 的 one-piece 人 工 智能 算法 。 

Pierre Dellacherie 算法 将 22.2.1 市 介绍 的 影响 俄罗斯 方块 游戏 的 抽象 参数 转化 为 6 种 具体 的 
届 性 ， 并 详细 定义 了 这 6 种 属性 。 
口 landingHeight: 指 当前 板块 放置 后 ,板块 重点 距离 游戏 区 域 底部 的 距离 ( 以 小 方 格 为 单位 ); 
口 erodedPieceCellsMetric: 这 是 消除 参数 的 体现 , 它 代 表 的 是 消去 的 行 数 与 当前 摆 放 的 板块 
中 被 消去 的 小 方 格 数 的 乘积 ; 

口 boardRowTransitions: 如 果 把 每 一 行 中 的 小 方 格 从 有 小 方块 填充 到 无 小 方块 , 或 从 无 小 方 
块 到 有 小 方块 填充 视 作 一 次 “变换 ”的 话 ， 这 个 属性 就 是 各 行 中 发 生变 换 的 次 数 之 和 ; 

口 boardColTransitions: 关于 “变换 ”的 定义 和 boardRowTransitions 一 样 ， 只 是 以 列 为 单位 
统计 变换 的 次 数 ; 

口 boardBuriedHoles: 各 列 中 “空洞 ”的 小 方 格 数 之 和 ; 

口 boardwells: 各 列 中 “并 ”的 深度 连 加 之 和 。 

landingHeight 属性 比较 简单 ,无需 多 做 说 明 。erodedpieceCellsMetric 属性 体现 了 消除 参数 的 
影响 ,但 是 对 它 进 行 了 适当 的 折 中 。 每 个 板块 由 四 个 小 方块 组 成 ， 如 果 能 同时 将 这 个 板块 的 四 个 
小 方块 都 消除 ， 其 结果 就 是 “ 行 数 x4”, 将 取得 明显 优势 。 但 是 如 果 只 能 消除 一 个 小 方块 ， 其 结 
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果 就 是 1， 所 产生 的 影响 很 容易 被 形成 一 个 “空洞 ”或 引起 一 次 “变换 ”所 抵消 ， 这 样 就 可 以 避 
免 类 似 图 22-3 所 示 的 例子 中 的 那 种 “偏激 ”的 选择 。boardRowTransitions 和 boardColTransitions 
属性 反映 的 是 小 方块 摆 放 的 紧密 程度 。 这 个 也 比较 容易 理解 ， 小 方块 摆 放 得 越 紧 密 ， 其间 的 空格 
就 越 少 ,小 方 格 状 态 之 间 的 变换 就 越 少 ,但 是 需要 注意 一 点 , 这 种 变换 要 考虑 边界 因素 。 可 以 这 
样 理解 ， 如 果 紧 邻 边 界 的 行 或 列 是 空 小 方 格 ， 则 视 为 一 次 “变换 *"， 即 边界 作为 被 填充 的 小 方 格 
参与 计算 。 

boardBuriedHoles 是 一 列 中 “空洞 ”的 小 方 格 数量 之 和 。 所 谓 的 “空洞 ”就 是 某 一 列 中 顶端 
被 小 方块 填 堵 住 的 空 小 方 格 ， 如 图 22-4 所 示 ， 带 有 方 框 标识 的 就 是 “空洞 "。 形 成 空洞 是 俄罗斯 
方块 游戏 中 最 坏 的 局 面 ， 要 极力 避免 这 种 情况 ， 因 此 Pierre Dellacherie 算法 给 “空洞 ”的 系数 是 
-4。boardnells 是 “ 井 ” 的 深度 连 加 之 和 。 首 先 来 定义 什么 是 “ 井 ”,“ 井 ”就 是 两 边 ( 包括 边界 ) 
都 由 方块 填充 的 空 列 。 图 22-5 就 是 很 多 资料 上 常 引用 的 “ 井 ” 的 示意 图 ， 其 中 带 有 方 框 标识 的 
就 是 两 个 “并 ”。“ 井 ”的 评价 记分 采用 的 是 连 加 求 和 , 一 个 “ 井 ” 中 连续 的 空 小 方 格 有 1 个 就 计 
1， 有 两 个 就 计 1+2=3 ， 有 三 个 就 计 1+2+3=6， 以 此 类 推 。 如 22-5 中 两 个 “ 井 ” 的 记分 之 和 就 是 
(1+2)+(1+2+3)= 9。 


FP 


到 到 到 
到 到 


图 22-4 “空洞 ”示意 图 图 22-5 “ 井 ” 示 意图 


接 下 来 介绍 Pierre Dellacherie 算 法 的 评估 函数 。 该 评 佑 函数 以 上 述 6 个 属性 为 输入 参数 ， 采 
用 线性 组 合 的 方式 ， 计 算出 最 后 的 评估 值 (value )， 其 计算 方法 如 下 : 

value = —landingHeight + erodedPieceCellsMetric -boardRowTransitions - boardColTransitions 一 
(4 * boardBuriedHoles) — board Wells (22-1) 

对 每 个 局 面 计算 应 用 上 述 公式 计算 value 值 ， 取 最 大 的 一 个 作为 最 后 的 选择 。 如 果 两 个 局 面 
的 评分 相同 怎么 办 ? 两 个 局 面 的 value 值 相同 是 一 种 很 普遍 的 情况 ， 为 此 Pierre Dellacherie 算法 
又 定义 了 一 个 优先 度 的 概念 ， 当 两 个 局 面 的 value 值 相同 的 时 候 ， 取 优先 度 大 的 那个 作为 最 后 的 
选择 ， 优 先 度 的 定义 如 下 。 
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如 果 板块 摆 放 在 游戏 区 域 的 左 侧 (1 ~5 列 ); 

priority = 100 x 板块 需要 水 平平 移 次 数 + 10 + 板块 需要 旋转 的 次 数 

如 果 板 块 摆 放 在 游戏 区 域 的 右 侧 (6~ 10 列 ): 

priority = 100 x 板块 需要 水 平平 移 次 数 + 板块 需要 旋转 的 次 数 

假如 游戏 中 新 的 板块 总 是 从 游戏 区 域 的 中 间 开 始 落下 , 那么 “板块 需要 水 平平 移 次 数 ” 就 是 
将 板块 摆 放 在 所 选 位 置 时 需要 水 平移 动 多 少 个 小 方 格 。 每 个 板块 最 终 摆 放 在 指定 位 置 后 ,其 形态 
不 一 定 就 是 初始 形态 ,可 能 需要 做 一 些 旋转 操作 才能 以 此 形态 放置 , 这 些 旋转 操作 的 次 数 就 是 " 板 
块 需要 旋转 的 次 数 ”。 

以 上 就 是 Pierre Dellacherie 评估 算法 的 核心 内 容 ， 主 要 就 是 式 (22-D) 所 代表 的 评估 函数 ， 这 
个 决定 了 俄罗斯 方块 游戏 AI 的 智能 。 接 下 来 ， 我 们 就 以 Pierre Dellacherie 评估 算法 为 基础 ， 编 
写 一 个 自动 玩 俄罗斯 方块 游戏 的 程序 。 
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Demaine 、Hohenberger 和 Liben-Nowell 在 参考 资料 中 中 初步 论证 了 俄罗斯 方块 游戏 是 NP 完 
全 问题 ( NP-complete )， 这 使 得 所 有 人 都 彻底 放弃 了 寻找 俄罗斯 方块 游戏 的 数学 公式 解法 。 目 前 
主要 的 几 种 俄罗斯 方块 游戏 人 工 智 能 算法 , 都 采用 了 穷 举 算法 ,只 是 在 穷 举 实现 的 细节 上 稍 有 不 
同 。 因 此 ， 基 于 传统 俄罗斯 方块 游戏 规则 制作 一 个 one-piece 算法 相当 地 简单 。 总 的 来 说 ， 俄 罗 
斯 方块 游戏 的 人 工 智 能 算法 都 由 两 个 核心 部 分 组 成 , 其 一 是 板块 摆 放 动作 引擎 , 此 引擎 负责 产生 
各 种 板块 的 摆 放 方法 ; 其 二 是 评估 函数 ， 对 每 种 板块 摆 放 方法 进行 评估 。 

板块 摆 放 动作 引擎 就 是 穷 举 所 有 可 能 的 板 岂 游 戏 
块 摆 放 方 法 ， 对 于 板块 的 所 有 可 能 的 旋转 状态 ， NNNNNNNNNNNN nex 
从 左 到 右 依次 进行 尝试 。 这 项 工作 的 核心 是 设计 
好 数据 结构 ， 人 处理 好 板块 之 间 的 冲突 检测 。 评 估 
函数 就 使 用 Pierre Dellacherie 评估 算法 ，22.2.3 
节 已 经 介绍 了 这 个 评估 算法 的 原理 ， 只 要 将 其 实 
现 算法 写 出 来 就 算 完 成 了 。 作 为 一 个 算法 验证 程 
序 , 不 需要 设计 复杂 的 图 形 界面 ， 结 果 评 估 和 板 
块 的 摆 放 都 是 内 存 中 的 数据 ， 可 以 使 用 简单 的 控 
制 台 界面 将 其 展示 出 来 , 如 图 22-6 所 示 。 剩 下 的 
工作 就 是 随机 生成 数 千 到 数 十 万 个 板块 ， 让 我 们 
的 算法 一 一 摆 放 它们 ， 看 看 我 们 的 算法 能 坚持 多 
长 时 间或 得 多 少 分 。 图 22-6 演示 程序 的 输出 界 卫 
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22.3.1 基本 数学 模型 和 数据 结构 定义 


要 让 计算 机 理解 俄罗斯 方块 游戏 , 需要 定义 数学 模型 。 俄 罗斯 方块 游戏 的 数学 模型 可 采用 棋 
盘 类 游戏 常用 的 数学 模型 来 定义 ， 把 游戏 区 域 比拟 为 棋盘 , 用 二 维 数 组 表示 这 个 区 域 的 状态 ， 同 
时 注意 处 理 好 边界 问题 。 在 此 基础 上 ,继续 定义 板块 形状 的 数据 结构 ,确定 板块 旋转 和 移动 的 数 
据 定义 以 及 板块 冲突 检测 的 规则 。 

1. 游戏 和 游戏 区 域 

俄罗斯 方块 游戏 包含 几 个 关键 要 素 , 分别 是 当前 游戏 区 域 的 状态 、 当 前 消除 的 行 数 、 当 前 得 
分 、 下 一 个 板块 的 形状 以 及 AI 算法 。 游 戏 区 域 有 10 x 20 个 小 方 格 组 成 ， 数 据 结构 定义 依然 采用 
二 维 数组 ， 因 为 要 考虑 边界 的 情况 ， 所 以 定义 为 12 x 22 的 二 维 数组 。 我 们 用 1 表示 小 方 格 被 占 
用 的 状态 ,用 0 表示 小 方 格 处 于 空 的 状态 ,用 一 个 大 于 0 的 值 表 示 边 界 方 格 ， 这 是 此 类 算法 处 理 
的 常用 技巧 。 当 前 已 经 消除 的 行 数 和 当前 得 分 是 游戏 进行 过 程 中 的 两 个 状态 , 用 整数 分 别 表 示 它 
们 就 可 以 了 。 除 此 之 外 , 增加 一 个 表示 当前 最 高 行 所 在 位 置 的 标识 : top_row， 进 行 板块 摆 放 位 置 
穷 举 的 时 候 ， 根 据 top_row 指示 的 位 置 可 以 减少 一 些 无 谓 的 摆 放 尝试 。 

最 后 ，RUSSIA_GAME 数据 结构 的 定义 如 下 : 


typedef struct tagRussiaGame 
{ 


int board[BOARD ROW][BOARD COL]; 
int top row; 
int score; 
int lines; 
}RUSSIA GAME; 


2. 板块 形状 的 定义 

标准 俄罗斯 方块 游戏 一 共 定义 了 7 种 板块 形状 , 每 种 形状 都 由 4 个 小 方块 组 成 , 我 们 用 一 个 
4x4 的 小 方 格 矩 阵 描述 每 一 个 板块 形状 ， 如 图 22-7 所 示 。 每 种 形状 的 板块 通过 旋转 可 以 产生 几 
种 不 同 的 形态 , O 型 板块 不 管 如 何 旋 转 都 只 有 一 种 形态 。I、S 和 乙 型 板块 通过 旋转 可 以 产生 两 种 
形态 , L、J 和 工 型 板块 通过 旋转 可 以 产生 4 种 形态 。 图 22-7 显示 了 如 何 用 4x4 的 算 阵 描述 这 些 
形状 经 过 旋转 产生 的 各 种 形态 ， 其 中 灰色 显示 的 小 方块 表示 板块 的 形状 。 由 小 方块 组 成 的 4x4 
和 矩阵 一 般 用 二 维 数组 定义 ,板块 的 旋转 可 以 采用 两 种 策略 。 一 种 策略 是 给 矩阵 中 的 每 个 小 方块 设 
定 一 个 坐标 , 需要 旋转 板块 时 就 根据 旋转 的 方向 和 角度 重新 计算 每 个 小 方块 的 坐标 , 使 灰色 显示 
的 小 方块 变换 到 正确 的 位 置 上 。 另 一 种 策略 就 是 将 每 个 板块 旋转 后 可 能 产生 的 各 种 形态 事先 准备 
好 ,存放 在 一 些 列 4x4 和 矩阵 中 ， 需 要 旋转 板块 时 就 根据 板块 形状 和 旋转 角度 直接 选择 这 些 事先 
准备 好 的 小 方 格 和 矩阵 使 用 。 由 于 每 种 板块 旋转 所 产生 的 形态 是 有 限 的 , 多 则 4 种 形态 , 少 则 1 种 
形态 ,因此 采用 第 二 种 策略 并 不 会 带 来 太 大 的 存储 负担 , 但 是 却 可 以 大 大 简化 算法 实现 , 因此 大 
多 数 俄罗斯 方块 游戏 都 是 采用 第 二 种 策略 来 处 理 板 块 旋转 。 
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图 22-7 板块 形状 数据 定义 示意 图 
R_SHAPE 数据 结构 定义 和 存储 一 个 板块 的 所 有 形态 信息 ，r_count 是 这 个 板块 旋转 时 可 能 产生 
的 不 同形 态 的 个 数 ， 对 于 O 型 板块 来 说 ，r_count 就 是 1， 对 于 T 型 板块 来 说 ，r_count 就 是 4。 
shape r 是 一 个 最 大 长 度 为 4 的 数组 ， 存 放 Yr_count 对 应 的 每 一 种 旋转 形态 。 


typedef struct tagRShape 


B_SHAPE shape r[MAX SHAPE R]; 
int r count; 
}R_SHAPE; 


B_SHAPE 是 每 种 具体 板块 形态 的 4x4 和 矩阵 定义 ， 二 维 数组 shape 就 存储 这 个 矩阵 。shape 中 的 
值 如 果 是 1, 则 表示 对 应 的 小 方 格 是 板块 形态 的 有 效 格子 ( 对 应 图 22-7 中 灰色 显示 的 小 方 格 ), 0 
表示 对 应 的 小 方 格 是 无 效 的 空格 子 ， 计 算 碰 撞 和 摆 放 时 可 以 忽略 0 对 应 的 无 效 格子 。width 和 
height 定义 板块 形态 在 4x4 和 矩阵 中 实际 占用 的 宽度 sn 以 图 22-7 所 示 的 S 型 板块 为 例 ， 其 
第 1 种 旋转 形态 的 宽度 是 3， 高 度 是 2， 第 二 种 旋转 形态 的 宽度 是 2， 高 度 是 3。 做 碰撞 检测 计算 
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时 ， 直 接 利 用 这 两 个 值 可 以 提高 检测 计算 的 效率 。 此 外 , 在 穷 举 板块 的 摆 放 位 置 时 ， 也 可 以 根据 
这 两 个 值 直接 排除 掉 一 些 明显 不 合适 的 位 置 。 
typedef struct tagBShape 


int shape[SHAPE BOX][SHAPE_ BOX]; 
int width; 
int height; 

}B_SHAPE; 


根据 以 上 数据 结构 定义 ， 用 7 个 R_SHAPE 类 型 元 素 组 成 的 数组 存放 事先 准备 好 的 板块 旋转 形 
态 数据 ， 算 法 实现 过 程 中 需要 引用 这 些 数据 时 ， 首 先 根据 板块 的 形状 编号 从 R_SHAPE 数组 中 找到 
板块 对 应 的 R_SHAPE 数据 ,然后 就 可 以 根据 旋转 角度 找到 R_SHAPE 数据 中 对 应 的 B_SHAPE 数据 。 如 
果 要 穷 举 R_SHAPE 板块 的 所 有 旋转 状态 ， 只 需 遍历 shape_r 数组 即 可 。 


22.3.2 ”算法 实现 


写 一 个 自动 玩 俄罗斯 方块 游戏 的 AI 算法 其 实 非 常 简单 ， 就 是 要 做 两 件 事情 : 一 是 穷 举 板 
块 的 所 有 摆 放 形态 和 摆 放 位 置 , 二 是 用 评估 函数 对 每 种 摆 放 方法 进行 评估 , 根据 评估 结果 选择 一 
个 最 佳 摆 放 位 置 。22.3.1 节 给 出 具体 的 的 数据 结构 定义 以 后 ， 原 来 抽象 的 方法 描述 和 算法 原理 就 
可 以 用 具体 的 方式 实现 了 。 首 先 来 看 看 Pierre Dellacherie 算法 的 评估 函数 如 何 实现 。 

1. Pierre Dellacherie 算法 评估 函数 

Pierre Dellacherie 算法 的 评估 函数 包含 6 个 属性 ， 现 在 就 来 介绍 如 何 从 一 个 游戏 “棋盘 ”局 
面 中 统计 出 这 6 个 属性 。 首 先是 landingHeight， 这 个 非常 简单 ， 由 于 数组 的 下 标 row 与 高 度 是 反 
对 称 的 ， 需 要 做 个 取 反 计算 : 

GetLandingHeight(RUSSIA GAME *game, B_SHAPE *bs, int row, int col) 

} 

接 下 来 计算 erodedPieceCellsMetric。GetErodedPieceCellsMetric 的 算法 实现 也 很 简单 ， 就 是 
从 top_row 开始 遍历 所 有 的 行 ， 如 果 发 现 某 一 行 可 以 消除 ， 则 计算 当前 板块 形状 中 有 多 少 小 方块 
属于 这 一 行 。erodedRow 记录 可 以 消除 多 少 行 ，erodedshape 记录 消除 的 行 中 有 多 少 小 方块 是 属于 
当前 摆 放 的 板块 ， 最 后 返回 它们 的 乘积 。 


int GetETodedPieceCellsMetric(RUSSIA_GAME *game, B_SHAPE *bs, int row, int col) 
{ 


return (GAME ROW - row); 


int erodedRow = 0; 

int erodedShape = 0; 

int i = game->top row; 

while(i < GAME ROW) 

{ 
if(IsFullRowStatus(game, i)) 
{ 


erodedRow++; 


22.3 ”Pierre Dellacherie 算法 实现 号 353 


if((i >= row) 8& (i <= (row + bs->height))) 
ll 


int sline 
for(int j 


= i - row; 
= 0; j < bs->width; j++) 


if(bs->shape[sline][j] != 0) 


erodedSshape++; 


return (erodedRow * erodedShape); 


boardRowTransitions 和 boardColTransitions 的 计算 也 非常 简单 。 以 GetBoardRowTransitions() 
函数 的 计算 为 例 ， 从 top_row 开始 遍历 所 有 的 行 , 对 每 一 行 统计 “变换 ”。 统 计 从 左边 界 开 始 到 右 
边界 结束 ， 注 意 这 个 算法 里 列 下 标 是 从 0 开始 的 ， 因 为 要 从 board 区 域 中 的 边界 开始 计算 。 计 算 
boardColTransitions 的 算法 实现 与 GetBoardRowTiansitions() 函 数 类 似 , 指示 将 遍历 方法 从 按照 行 
裔 历 改 成 按照 列 遍 历 。 


int GetBoardRowTransitions(RUSSIA GAME *game, B_ SHAPE *bs, int row, int col) 


{ 
int transitions = 0; 
for(int i = game->top row; i < GAME ROW; i++) 
{ 
for(int j = 0; j < (BOARD COL - 1); j++) 
{ 
if((game->board[i + 1][j] != 0)&&(game->board[i + 1][j + 1] == 0)) 
{ 
transitions++; 
} 
if((game->board[i + 1][j] == 0)&&(game->board[i + 1][j + 1] != 0)) 
{ 
transitions++; 
} 
} 
} 
return transitions; 2 
} 


“空洞 ”是 一 个 很 关键 的 属性 ,但 是 计算 boardBuriedHoles 的 算法 并 不 复杂 。 遍 历 board 的 每 
一 列 ， 对 每 一 列 从 top_row 开始 找 第 一 个 填充 的 小 方块 (第 一 个 while 循环 )， 找 到 之 后 再 继续 找 
这 个 小 方块 之 下 所 有 的 空 小 方 格 ， 统 计 它 们 的 数量 之 和 (第 二 个 while 循环 )。 


int GetBoardBuriedHoles(RUSSIA GAME *game, B_SHAPE *bs, int row, int col) 


int holes = 0; 
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for(int j = 0; j < GAME COL; j++) 
{ 
int i = game->top row; 
while((game->board[i + 1][j + 1] == 0) 8& (i < GAME ROW)) 
I++; 
while(i < GAME ROW) 
{ 
if(game->board[i + 1][j + 1] == 0) 
holes++; 
} 
I++; 
} 


return holes; 


“和 井 ” 的 计算 仍然 以 列 为 单位 进行 扫描 , 对 每 一 列 从 top_row 开始 处 理 ， 如果 某 个 小 方 格 是 空 
状态 ， 但 是 其 左右 相 邻 的 两 列 (包括 边界 ) 都 是 填充 的 小 方 格 ， 则 统计 井深 的 wells 计数 器 + 
当 遇 到 一 个 小 方块 是 填充 状态 时 ， 一 个 井深 的 统计 结束 ， 根 据 wells 计数 器 计算 sum， 然 后 wells 
计数 需 清 0， 准备 继续 统计 下 一 个 “ 井 ” 的 深度 。 


int GetBoardWells(RUSSIA GAME *game, B SHAPE *bs, int row, int col) 


js 


O 


int wells = 0; 
int sum = 0; 
for(int j = 0; j < GAME COL; j++) 


{ 
for(int i = game->top row; i <= GAME ROW; i++) 
{ 
if(game->board[i + 1][j + 1] == 0) 
if((game->board[i + 1][j]!= 0)8&(game->board[i + 1][j + 2]!=0)) 
{ 
wells++; 
} 
} 
else 
{ 
sum += sum n[wells]; 
wells = 0; 
} 
} 
} 


return sum; 


} 

统计 sum 的 时 候 ， 假 如 井深 是 上， 需要 计算 从 1 到 的 和 ， 这 一 步 我 们 再 次 使 用 了 以 空间 换 
时 间 的 策略 ， 预 先 计算 好 从 1 到 n 各 数列 的 和 ， 存 放 在 sumn_n 表 中 ， 然 后 用 n 作为 数组 下 标 直 接 
得 到 对 应 的 和 。 游 戏 区 域 最 高 就 是 20 行 ， 因 此 井深 不 会 超过 20， 只 需 计 算 20 个 数列 和 存放 在 
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sum_n 表 即 可 。 
int sum n[] = { 0, 1, 3, 6, 10, 15, 21, 28, 36, 45, 55, 66, 78, 91, 105, 120, 136, 153, 171, 190, 210 }; 
现在 我 们 已 经 有 了 6 个 属性 的 计算 方法 ， 按 照 式 22-1) 给 出 的 计算 方法 写 出 评估 函数 即 可 : 


int EvaluateFunction(RUSSIA GAME *game, B_SHAPE *bs, int row, int col) 
{ 


int evalue = 0; 


t lh = GetLandingHeight(game, bs, row, col); 
t epcm = GetErodedPieceCellsMetric(game, bs, row, col); 


Pu 


t brt = GetBoardRowTransitions(game, bs, row, col); 
t bct = GetBoardColTransitions(game, bs, row, col); 
t bbh = GetBoardBuriedHoles(game, bs, row, col); 


t bw = GetBoardWells(game, bs, row, col); 
evalue = (-1) * Jh + epcm - brt - bct - (4 * bbh) - bw; 
return evalue; 
} 
最 后 是 优先 度 选择 , 假如 两 个 局 面 的 评估 值 一 样 ， 就 需要 按照 优先 度 进行 选择 ,优先 度 计 算 
的 算法 如 下 : 


int PrioritySelection(RUSSIA GAME *game, int r index, int row, int col) 


{ 


int priority = 0; 
if(col < (GAME COL / 2)) 
priority = 100 * ((GAME COL / 2 - 1) - col) + 10 + r index; 
} 
else 


{ 
} 


priority = 100 * (col - (GAME COL / 2)) + r_index; 


return priority; 


} 

这 个 算法 实现 基本 上 就 是 按照 22.2.3 节 给 出 的 公式 进行 计算 ，r_index 代表 的 旋转 次 数 实际 
上 就 是 R_SHAPE 数据 结构 中 shape _r 数组 的 下 标 。 这 个 很 容易 理解 ， 因 为 我 们 的 穷 举 算法 总 是 按 
照 一 个 旋转 方向 ( 顺 时 针 方向 ) 遍历 shape r 数 组 ， 所 以 其 下 标 就 代表 了 旋转 次 数 。 

2. 穷 举 板块 的 摆 放 方法 

板块 摆 放 方法 的 穷 举 分 两 个 步骤 , 第 一 个 步 又 是 对 板块 的 每 种 旋转 形态 进行 遍历 , 第 二 步 是 
对 每 种 旋转 形态 按照 从 左 到 右 的 顺序 ， 依 次 在 每 个 位 置 上 尝试 摆 放 。 第 一 步 比 较 简 单 ， 就 是 对 
R_SHAPE 数据 结构 中 的 shape 工 数组 进行 遍历 。ComputerAIP1ayer() 函 数 是 AI 算法 的 核心 ， 其 作用 
就 是 模拟 人 类 玩 俄罗斯 方块 游戏 的 方式 将 一 个 指定 的 板块 摆 放 在 最 合理 的 位 置 上 。 遍历 的 第 一 个 
步骤 ， 也 就 是 对 shape r 数组 的 遍历 算法 就 在 这 个 函数 中 : 
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bool ComputerAIPlayer(RUSSIA GAME *game, SHAPE_T s) 
{ 
bool res find = false; 
EVA RESULT best r = { 0, 0, 0, -999999,-999999 }; 


R_SHAPE *rs = &g shapes[s - 1]; 

// 遍 历 每 个 板块 的 形状 ， 相 当 于 旋转 板块 

for(int i = 0; i < rs->r count; i++) 

{ 
B_SHAPE *bs = 8&rs->shape r[i]; 
EVA RESULT evr = { i, 0, 0, -999999, -999999 }; 
int rtn = EvaluateShape(game, bs, &evr); 
if((evr.value > best r.value) 


{ 


|| ((evr.value == best r.value) 8& (evr.prs > best r.prs))) 


res find = true; 
best r = evr; 


} 


} 
if(res find) 
{ 


} 


PutShapeInplace(game, &rs->shape r[best r.r index], best r.row, 


return res find; 


} 

best r 中 存放 最 终 得 到 的 摆 放 板块 的 最 佳 位 置 和 板块 的 旋转 状态 ， 
据 这 个 结果 将 板块 旋转 并 放置 到 指定 的 位 置 ， 同 时 计算 消除 行 并 记分 。 
戏 区 域 的 0 列 开 始 ， 逐 个 位 置 和 尝试 摆 放 这 个 板块 : 


int EvaluateShape(RUSSIA GAME *game, B_SHAPE *bs, EVA RESULT *result) 
{ 


int start row = GetTouchStartRow(game, bs); 
if(start row < 0) 
return -1; 


for(int col = 0; col < (GAME COL - bs->width + 1); col++) 
{ 
int row = start row; 
// 是 否 还 能 向 下 ? 如 果 能 就 再 下 降 一 行 ， 直 到 停 下 
while(CanShapeMoveDown(game, bs, row, col)) 


{ 
} 


AddShapeOnGame (game, bs, row, col, true); 
int values = EvaluateFunction(game, bs, row, col); 
int prs = PrioritySelection(game, bs->r index, row, col); 
RemoveShapeFromGame (game, bs, row, col); 
if((values > result->value) 
|| ((values == result->value) 8& (prs > result->prs))) 


IOW++; 


result->row = row; 


best r.col); 


putShapeInPlace() 消 数 根 
EvaluateShape() 销 数 从 游 
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result->col = col; 
result->value = values; 
result->prs = prs; 
} 
} 


return 1; 

} 

从 0 列 开始 的 遍历 在 for 循环 内 完成 ， 但 是 在 这 之 前 ， 首 先 要 确定 行 的 起 始 位 置 。 
GetTouchstartRow() 函数 用 于 确定 起 始 行 位 置 ,计算 的 依据 就 是 当前 的 top_row 和 当前 板块 的 高 度 ， 
从 top_row 指定 的 位 置 向 上 修正 板块 高 度 。 如 果 当 前 top_row 之 上 的 空间 比 板块 的 高 度 小 ， 则 说 
明 没 有 空间 可 以 摆 放 这 个 板块 ， 也 就 是 应 该 Game Over 了 。CanShapeMoveDown() 函 数 判 断 板块 在 
这 个 位 置 是 否 还 可 以 继续 向 下 移动 ， 当 所 在 的 列 存在 “ 井 ” 或 开放 的 “空洞 ”时 ,板块 是 有 可 能 
继续 向 下 移动 的 ， 所 以 要 处 理 这 种 情况 。while 循环 调用 canShapeMoveDown() 函 数 ， 直 到 不 能 再 下 
降 为 止 。AddshapeoOnGame() 函数 将 板块 临时 放置 在 指定 为 止 ， 然 后 调用 EvaluateFunction() 函数 进 
行 评估 ， 完 成 评估 之 后 ， 调 用 RemoveSshapeFromGame() 函 数 取 消 这 次 临时 放置 ， 使 得 游戏 局 面 恢 复 
到 之 前 的 位 置 , 准备 下 一 个 位 置 的 评估 。 得 到 一 个 位 置 的 评估 值 和 优先 度 值 之 后 ,根据 评估 值 的 
高 低 更 新 result 中 的 值 。 

3. 测试 我 们 的 Al 算法 

测试 的 方法 非常 简单 ， 就 是 随机 生成 几 千 到 几 十 万 个 板块 ， 然 后 让 我 们 的 AI 算法 一 一 摆 放 
它们 ， 看 看 最 后 能 得 到 什么 结果 。 首 先 用 GenerateShapeList() 函 数 随机 生成 10 万 个 板块 ， 然 后 
逐个 “ 喂 ” 给 代表 计算 机 AI 的 ComputerAIPlayer() 函 数 。PrintGame() 函 数 打 印 如 图 22-6 所 示 的 一 
个 中 间 状 态 。 如 果 将 打印 输出 重 定向 到 一 个 文件 中 , 可 以 看 到 我 们 的 AI 算法 摆 放 这 10 万 个 板块 
的 完整 过 程 。 


std: :Vector<SHAPE T> shape list; 
RUSSIA GAME game; 


InitGme(&game); 
GenerateShapelList(100000, shape list); 
for(auto i = 0; i < shape list.size(); i++) 


{ 
PrintGame(&game, shape list[i]); 
if(!ComputerAIPlayer(&game, shape list[i])) 
{ 
std::cout << "Failed at: "<< i+1 «< " pieces!" «<x std::endl; 
break; 
} 
} 


我 们 的 AI 算法 最 好 的 结果 是 消除 了 26 万 行 , 平均 可 以 消除 8 万 行 左 右 , 这 比 一 些 优秀 的 算 
法 差 远 了 。 如 果 你 耐心 看 ComputerAIPlayer() 函 数 “ 玩 ”游戏 的 整个 过 程 ， 你 会 发 现 这 个 AI 经 党 
做 出 一 些 “ 自 杀 ” 性 举动 ， 说明 我 们 的 算法 还 有 很 大 的 改进 余地 ,评估 函数 还 可 以 继续 优化 。 本 
章 的 参考 资料 里 也 列举 了 各 种 优秀 的 算法 供 大 家 参考 。 
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22.4 总 结 


好 了 ， 就 是 这 样 ， 实 现 一 个 自动 玩 俄罗斯 方块 游戏 的 AI 算法 非常 简单 ， 相 信 你 已 经 能 体会 
到 站 在 巨人 的 肩膀 上 的 好 处 了 。 不 过 话 又 说 回来 ， 要 做 好 一 个 AI 算法 也 不 是 那么 容易 的 。 首 先 
我 们 的 算法 实现 还 有 很 多 可 以 优化 的 地 方 ， 比 如 数据 结构 的 优化 ， 可 以 用 一 维 bit 位 组 代替 二 维 
数组 ， 这 样 就 可 以 充分 利用 现代 CPU 的 128 位 寄存 需 和 相关 的 指令 优化 算法 的 速度 。 其 次 ,我 
们 的 评估 算法 还 可 以 再 优化 ， 比 如 使 用 更 好 的 评估 策略 ， 重 新 定义 “空洞 ”的 概念 ， 区 分 完全 封 
闭 的 “空洞 ”和 可 以 填充 的 开放 性 “空洞 ”或 者 支持 板块 下 落 过 程 中 平移 或 旋转 ( 用 于 填补 侧面 
的 开放 性 “空洞 ”) 等 ,这些 都 是 提高 算法 的 AI 的 一 些 研究 方向 。 

最 后 ,你 玩 过 在 线 俄 罗斯 方块 对 战 游戏 吗 ? 你 被 对 手 虐 过 吗 ? 你 肯定 猜 他 们 开 挂 了 , 但 是 是 
什么 原理 ?你 现在 知道 了 吧 ? 
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第 22. 了 章 
博弈 树 写 模 类 游戏 


1997 年 5 月 11 日 ,国际 象棋 世界 冠军 卡 斯 帕 罗 夫 在 一 场 挑 战 赛 中 以 2.5 : 3.5 输 给 了 “深蓝 ”， 
特别 是 最 后 一 局 ， 卡 斯 帕 罗 夫 只 走 了 19 步 就 投 子 认输 了 。 这 个 结果 震惊 了 全 世界 ， 要 知道 “ 深 
蓝 ” 并 不 是 人 类 ， 它 只 是 一 台 几 吨 重 的 计算 机 而 已 。 卡 斯 由 罗 夫 之 前 曾经 和 “深蓝 ”的 前 辈 “ 深 
思 ” 过 招 几 次 ,“ 深 思 ” 每 次 都 输 得 很 惨 。 就 在 一 年 前 , 卡 斯 帕 罗 夫 还 曾经 以 4 : 2 战胜 过 “深蓝 ” 
的 一 个 初级 版 本 。 卡 斯 帕 罗 夫 曾 预言 计算 机 在 2010 年 之 前 不 可 能 战胜 人 类 ,但 是 IBM 的 科学 家 
让 这 个 结果 提前 了 13 年 。 创 新 工厂 的 创始 人 李开复 博士 在 学 校 期 间 ， 也 曾 开 发 过 一 个 黑白 棋 
( Othello ) 的 AI 算 法， 据说 还 战胜 了 当时 美国 黑白 棋 世 界 冠军 。 还 是 那 句 话 :“ 外 行 看 热 阐 ， 内 
行 看 门道 ”， 作 为 程序 员 我 们 应 该 知道 这 “神奇 ”的 现象 的 背后 一 定 是 某 种 算法 在 “ 作 景 ”。 

棋 类 游戏 通常 包含 三 大 要 素 : 棋盘 、 棋 子 和 游戏 规则 ， 其 中 游戏 规则 又 包括 胜 负 判 定 规则 、 
落 子 的 规则 以 及 游戏 的 基本 策略 。 设 计 一 个 棋 类 游戏 的 AI 算法， 棋盘 和 棋子 的 建 模 是 相对 比较 
简单 的 部 分 ， 而 游戏 规则 的 建 模 相 对 比较 复杂 。 很 多 情况 下 ， 越 是 简单 的 规则 越 难以 建 模 ， 比 如 
围棋 ， 目 前 还 没有 一 种 有 效 的 理论 能 够 对 围棋 的 “ 形 ” 和 “ 势 ” 进 行 建 模 ， 使 得 计算 机 能 像 人 类 
一 样 理解 一 个 围棋 棋 局 。 那 么 棋 类 游戏 的 AI 到 底 是 什么 原理 ? 很 简单 ， 既 然 不 能 让 计算 机 像 人 
一 样 思 考 , 那 就 利用 计算 机 强大 的 计算 和 数据 处 理 能 力 搜索 结 果 吧 。 当 然 , 对 于 很 多 棋 类 游戏 来 
说 ,， 穷 举 搜 索 所 有 的 棋局 是 不 现实 的 ， 比 如 围棋 ， 因 此 需要 一 些 理论 和 算法 来 支撑 搜索 工作 ， 这 
就 是 本 章 要 介绍 的 棋 类 游戏 的 AI 算法 原理 。 棋 类 游戏 的 人 工 智 能 是 各 种 人 工 智 能 技术 中 最 基础 
的 一 类 ( 或 者 说 根本 算 不 上 是 AI )， 而 与 博弈 树 理论 相关 的 各 种 算法 则 是 棋 类 游戏 人 工 智 能 算法 
的 核心 ， 本 章 将 介绍 博弈 树 相关 的 算法 在 棋 类 游戏 中 的 应 用 。 
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前 面 已 经 提 到 过 ， 除 了 棋盘 和 棋子 的 建 模 ， 棋 类 游戏 最 重要 的 部 分 就 是 AI 算法 的 设计 。 目 
前 棋 类 游戏 的 AI 基本 上 就 是 带 启发 的 搜索 算法 ,那么 ， 这 些 搜索 算法 是 建立 在 什么 理论 基础 上 
的 ?常用 的 搜索 算法 有 哪些 ? 一 个 棋 类 游戏 的 AI 算法 通常 都 包含 哪些 内 容 ?” 本 节 就 来 解答 这 些 


问题 。 


Sap 
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23.1.1 博弈 与 博弈 树 


首先 介绍 一 下 什么 是 博弈 。 博 弈 可 以 理解 为 有 限 参 与 者 进行 有 限 策略 选择 的 竞争 性 活动 , 比 
如 下 横 、 打 牌 、 竞 技 、 战 争 等 。 根 据 参 与 者 种 类 和 策略 选择 的 方式 可 以 将 博弈 分 成 很 多 种 ,本章 
讨论 的 是 与 棋 类 游戏 有 关 的 简单 的 “二 人 零 和 、 全 信息 、 非 偶然 ”博弈 ， 也 就 是 我 们 常 说 的 零 和 
博弈 (Zero-sum Game )。 所 谓 “ 零 和 ”， 就 是 有 赢 必 有 输 ， 不 存在 双赢 的 结果 。 所 谓 “ 全 信息 ”， 
是 指 参与 博弈 的 双方 进行 决策 时 能 够 了 解 的 信息 是 公开 和 透明 的 , 不 存在 信息 不 对 称 的 情况 。 比 
如 棋 类 游戏 的 棋盘 和 棋子 状态 是 公开 的 , 下 棋 的 双方 都 可 以 看 到 当前 所 有 棋子 的 位 置 , 但 是 很 多 
牌 类 游戏 则 不 满足 全 信息 的 条 件 , 因为 牌 类 游戏 都 不 会 公开 自己 手中 的 牌 , 也 看 不 到 对 手 手中 的 
牌 。 所 谓 的 “ 非 偶 然 "， 是 指 参与 博弈 的 双方 的 决策 都 是 “理智 ”的 行为 ， 不 存在 失误 和 碰 运 气 
的 情况 。 

在 博弈 过 程 中 ， 任 何 一 方 都 希望 自己 取得 胜利 ， 当 某 一 方 当 前 有 多 个 行动 方案 可 供 选 择 时 ， 
他 总 是 挑选 对 自己 最 为 有 利 同 时 对 对 方 最 为 不 利 的 那个 行动 方案 。 当 然 , 博弈 的 另 一 方 也 会 从 多 
个 行动 方案 中 选择 一 个 对 自己 最 有 利 的 方案 进行 对 抗 。 参 与 博弈 的 双方 在 对 抗 或 博弈 的 过 程 中 会 
遇 到 各 种 状态 和 移动 ( 也 可 能 是 棋子 落 子 ) 的 选择 ,博弈 双方 交替 选择 ， 每 一 次 选择 都 会 产生 一 
个 新 的 棋局 状态 。 假 设 两 个 棋 手 ( 可 能 是 两 个 人 ,也 可 能 是 两 台 计 算 机 ) MAX 和 MIN 正在 一 个 
棋盘 上 进行 博弈 。 当 MAX 做 选择 时 , 主动 权 在 MAX 手中 , MAX 可 以 从 多 个 可 选 决 策 方案 中 任 
选 一 个 行动 ， 一 旦 MAX 选 定 某 个 行动 方案 后 ， 主 动 权 就 转移 到 了 MIN 手中 。MIN 也 会 有 若干 
个 可 选 决 策 方案 ，MIN 可 能 会 选择 任何 一 个 方案 行动 ， 因 此 MAX 必须 对 做 好 应 对 MIN 的 每 一 
种 选择 。 如 果 把 棋盘 抽象 为 状态 ， 则 MAX 每 选择 一 个 决策 方案 就 会 触发 产生 一 个 新 状态 ，MIN 
也 同样 ， 最 终 这 些 状 态 就 会 形成 一 个 状态 树 ， 这 个 附加 了 MAX 和 MIN 的 决策 过 程 信息 的 状态 
树 就 是 博 弃 树 ( Game Tree )。 博 弈 树 的 根 就 是 搜索 开始 时 的 棋盘 状态 ， 每 一 个 子 节点 就 是 MAX 
的 每 一 种 决策 方案 可 能 产生 的 棋盘 状态 ( 局面 )， 而 这 些 子 节点 的 子 节点 则 是 MIN 的 每 一 种 决策 
方案 可 能 产生 的 棋盘 状态 (各 层 相 互 间隔 )。 这 棵 树 的 叶子 节点 就 是 最 终结 局 ， 结 果 无 非 三 种 : 
MAX 胜利 、MIN 胜利 或 者 平局 。 

博弈 树 的 搜索 就 是 从 一 个 棋局 状态 开始 , 对 每 一 步 棋子 移动 产生 新 的 棋局 状态 进行 判断 , 看 
看 是 赢 还 是 输 ， 直 到 最 终 得 到 整 棵 树 的 判断 结果 。 根 据 这 个 搜索 过 程 ， 如 果 MAX 和 MIN 都 知 
道 这 棵 博弈 树 的 全 部 状态 ， 则 结果 将 变 得 没有 悬念 。 除 非 存在 一 个 必 胜 的 〈 棋局 状态 ) 节点 序列 
(就 像 古老 的 井 字 棋 游 戏 那样 ), 否则 平局 将 是 所 有 博弈 最 后 的 结局 , 所 有 的 棋 类 游戏 都 将 变 得 无 
聊 至 极 。 幸 运 的 是 ( 反 过 来 也 可 以 理解 为 不 幸 )， 人 类 的 大 脑 处 理 不 了 这 么 多 状态 ， 因 此 人 类 对 
弈 的 结局 依然 充满 了 悬念 。 对 于 计算 机 来 说 , 以 目前 计算 机 的 处 理 能 力 要 处 理 如 此 多 的 节点 也 是 
不 现实 的 。 以 中 国 象棋 为 例 ， 建 立 一 棵 双方 各 走 50 步 的 博弈 树 需 要 生成 大 约 10.® 个 节点 ， 即 使 
处 理 一 个 节点 只 需要 10 飞 秒 ， 要 处 理 这 棵 树 也 需要 10”" 年 以 上 趾 。 至 于 围棋 ， 据 估算 ， 其 博弈 
树 的 节点 数 大 约 在 10””~ 102B1]。 由 此 可 见 ， 对 于 大 多 数 棋 类 游戏 来 说 ， 用 建立 完整 的 博弈 树 ， 
从 根 节点 到 叶子 节点 完整 地 搜索 博弈 树 是 不 现实 的 。 所 以 复杂 棋 类 游戏 的 搜索 算法 通常 都 需要 指 
定 一 个 搜索 深度 ， 当 达到 搜索 深度 时 就 直接 评估 棋局 ， 在 时 间 和 准确 度 之 间 做 一 个 折 中 。 
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23.1.2 极 大 极 小 值 搜 索 算 法 


博弈 树 搜索 是 各 种 棋 类 游戏 AI 算法 的 基础 ， 极 大 极 小 值 (Min-Max ) 搜索 算法 是 各 种 博弈 
树 搜索 算法 中 最 基础 的 搜索 算法 。 假 如 MAX 和 MIN 两 个 人 在 下 棋 ，MAX 会 对 所 有 自己 可 能 的 
落 子 后 产生 的 局 面 进行 评估 ， 选 择 评估 值 最 大 的 局 面 作为 自己 落 子 的 选择 。 这 时 候 就 该 MIN 落 
子 , MIN 当然 也 会 选择 对 自己 最 有 利 的 局 面 , 这 就 是 双方 的 博弈 , 即 总 是 选择 最 小 化 对 手 的 最 大 
利益 ( 令 对 手 的 最 大 利益 最 小 化 ) 的 落 子 方法 。 作 为 一 种 博弈 搜索 算法 ,， 极 大 极 小 值 搜索 算法 的 
名 字 就 由 此 而 来 。 

从 下 棋 的 角度 考虑 ， 是 MAX 和 MIN 双方 轮流 落 子 ， 但 是 搜索 算法 的 角度 考虑 ， 只 能 以 其 
中 一 方 为 基准 进行 搜索 。 接 下 来 我 们 就 站 在 MAX 的 立场 上 分 析 一 下 极 大 极 小 值 搜索 算法 的 搜索 
过 程 。 首 先 我 们 知道 , 极 大 极 小 值 搜索 也 将 得 到 一 棵 博弈 树 , 称 为 极 大 极 小 博 弃 树 ( Minimax Game 
Tree )。 这 棵 树 的 根 (第 0 层 ) 是 搜索 的 开始 状态 。 树 的 第 1 层 节 点 是 MAX 的 选择 节点 ， 这 一 层 
的 节点 MAX 将 选择 对 自己 最 有 利 的 评估 最 大 值 , 称 为 极 大 值 节点 。 树 的 第 2 层 节 点 是 MIN 选择 
节点 ， 这 一 层 的 节点 MAX 将 选择 对 自己 最 不 利 的 评估 最 小 值 ， 因 为 这 一 层 是 对 MIN 落 子 后 的 
局 面 进行 评估 ， 站 在 MIN 的 立场 进行 选择 ， 所 以 这 一 层 的 节点 又 称 为 极 小 值 节点 。 极 大 值 节点 
和 极 小 值 节 点 交错 出 现在 每 一 层 , 直到 最 后 一 层 的 叶子 节点 对 棋局 进行 评估 , 所谓 的 叶子 节点 其 


实 就 是 搜索 达到 终局 状态 或 达到 指定 的 搜索 深度 时 的 节点 。 
23-1 是 简单 的 并 字 棋 游戏 的 极 大 极 小 博弈 树 的 一 部 分 ， 第 1 层 是 极 大 值 节点 ， 三 种 落 子 
位 置 得 到 的 评估 值 分 别 是 -1，0 和 -2，MAX 会 选择 评估 值 最 大 的 节点 ， 也 就 是 落 子 在 中 间 位 置 


的 局 面 ， 这 个 局 面 的 估 值 是 1。 那 么 这 一 层 的 评估 值 是 怎么 得 到 的 呢 ? 那 就 是 根据 第 2 层 的 评估 
值 进 行 选择 。 第 2 层 是 极 小 值 节 点 ，MAX 会 选择 对 自己 最 不 利 的 局 面 ， 也 就 是 说 ,MAX 对 每 个 
分 支 都 会 选择 评估 最 小 的 值 作 为 第 1 层 节 点 的 佑 值 。 对 于 第 一 个 分 支 , MAX 选择 -1 作为 评估 值 ， 
对 于 第 二 个 分 支 ， MAX 选择 1 作为 评估 值 ， 对 于 第 三 个 分 支 ， MAX 选择 -2 作为 评估 值 ， 这 就 
是 第 1 层 三 个 局 面 评 估 值 的 由 来 。 


. ei 
1 和 非 ca 皇 口 中 [2 


SS 


0 
2 


1 0 二 1 0 1 


MD 
可 
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根据 以 上 分 析 ， 我 们 可 以 给 出 极 大 极 小 值 算法 的 伪 代 码 : 


int MiniMax(node, depth, isMaxPlayer) 


if(depth == 0) 
{ 


} 


int score = isMaxPlayer ? -INFINITY : INFINITY 
for_each(node 的 子 节点 child_node) 


return Evaluate(node ) ; 


{ 
int value = MiniMax(child node, depth - 1, !isMaxPlayer); 
if(isMaxPlayer) 
score = max(score, value); 
else 
score = min(score, value); 
} 


下 
有 了 “o-B” 剪 枝 算法 之 后 ， 当 然 不 会 有 人 再 直接 使 用 极 大 极 小 值 算法 ， 但 它 仍然 是 我 们 理 
解 其 他 搜索 算法 的 基础 。 


23.1.3 ”负极 大 极 搜索 算法 

博弈 树 的 搜索 是 一 个 递归 的 过 程 , 极 大 极 小 值 算法 在 递归 搜索 的 过 程 中 需要 在 每 一 步 区 分 当前 
评估 的 是 极 大 值 节点 还 是 极 小 值 节点 。1975 年 Knuth 和 Moore 提出 了 一 种 消除 MAX 节点 和 MIN 
节点 区 别 的 简化 的 极 大 极 小 值 算法 加 ， 称 为 负极 大 值 算法 (Negamax )。 该 算法 的 理论 基础 是 : 

max(a,b) = -min(-a，-b) 

简单 地 将 递归 函数 MiniMax() 返 回 值 取 负 再 返回 ， 就 可 以 将 所 有 的 MIN 节点 都 转化 为 MAX 
节点 ， 对 每 个 节点 的 搜索 都 尝试 让 节点 值 最 大 ， 这 样 就 将 每 一 步 递归 搜索 过 程 都 统一 起 来 。 

根据 以 上 分 析 ， 我 们 可 以 给 出 负极 大 值 算法 的 伪 代 码 ， 其 中 color 参数 相当 于 传递 了 一 个 符 


号 位 : 


int NegaMax(node, depth, color) 


if(depth == 0) 
{ 


j 


int score = -INFINITY; 
for_each(node 的 子 节点 child_node) 


return color * Evaluate(node); 


int value = -NegaMax(child node, depth - 1, -color); 
score = max(score, value); 
4 
} 
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23.1.4 “a-B” 剪 枝 算法 


博弈 树 搜索 算法 很 简单 ， 但 是 需要 搜索 的 状态 是 相当 多 的 。 以 简单 的 井 字 棋 ( Tic-Tac-Toe ) 
游戏 为 例 ， 当 设 定 搜索 深度 是 6 时 , 不 带 任何 优化 的 极 大 极 小 值 搜索 算法 确定 第 一 个 落 子 时 需要 
搜索 56160 个 状态 。 如 果 是 五 子 棋 或 围棋 这 样 的 复杂 棋 类 游戏 ,搜索 的 状态 数 会 是 天 文 数字 ， 
此 需要 一 些 优化 方法 对 简单 搜索 算法 进行 优化 。“ 剪 枝 ” 是 搜索 算法 中 常见 的 优化 方法 ， 通 过 减 
除 一 些 明显 不 可 能 得 到 正确 解 的 状态 ,避免 对 这 些 状态 的 搜索 ， 可 以 提高 搜索 算法 的 效率 。 本 节 
我 们 将 介绍 一 种 可 应 用 于 极 大 极 小 值 算法 和 负极 大 值 算法 的 剪 枝 算法 “a-B” 前 校 算法 
(Alpha-beta Pruning )。 


有 很 多 资料 将 “au-B” 剪 枝 算法 称 为 “ao-B” 搜 索 算 法 ,实际 上 ， 它 不 是 一 种 独立 的 搜索 算法 ， 
而 是 一 种 嫁接 在 极 大 极 小 值 算法 和 负极 大 值 算法 上 的 一 种 优化 算法 。“a-B” 剪 枝 算法 维护 了 一 个 
搜索 的 极 大 极 小 值 窗口 : [w B]。 其 中 a 表示 在 搜索 进行 到 当前 状态 时 ,博弈 的 MAX 一方 所 追寻 
的 最 大 值 中 最 小 的 那个 值 (也 就 是 MAX 的 最 坏 的 情况 )。 在 每 一 步 的 搜索 中 , 如 果 MAX 所 获得 
的 极 大 值 中 最 小 的 那个 值 比 a 大 ， 则 更 新 a 值 (用 这 个 最 小 值 代 检 a )， 也 就 是 提高 a 这 个 下 限 。 
而 了 B 表示 在 搜索 进行 到 当前 状态 时 ,博弈 的 MIN 一 方 的 最 小 值 中 最 大 的 那个 值 (也 就 是 MIN 的 
最 坏 的 情况 )。 在 每 一 步 的 搜索 中 ， 如 果 MIN 所 获得 的 极 小 值 中 最 大 的 那个 值 比 B 小 ， 则 更 新 B 
值 (用 这 个 最 大 值 代替 B )， 也 就 是 降低 B 这 个 上 限 。 当 某 个 节点 的 a=B 了 时 , 说 明 该 节点 的 所 有 
子 节点 的 评估 值 既 不 会 对 MAX 更 有 利 ， 也 不 会 对 MIN 更 有 利 ， 也 就 是 对 MAX 和 MIN 的 选择 
不 会 产生 任何 影响 ， 因 此 就 没有 必要 再 搜索 这 个 节点 及 其 所 有 子 节点 了 。 

“o-B” 剪 枝 算法 实际 上 是 两 个 过 程 ， 分 别 是 极 小 值 节 点 的 “o 剪 枝 ” 和 极 大 值 节 点 的 “B 剪 
枝 ”"， 接 下 来 我 们 用 两 幅 图 分 别 说 明 一 下 这 两 个 剪 枝 过程 的 原理 。 图 23-2 是 “0 剪 枝 ”过 程 示 意 
图 。 极 大 值 节 点 A 搜索 博弈 树 时 会 从 两 个 极 小 值 节 点 B 和 C 中 选择 评估 值 最 大 的 一 个 节点 ， 而 
B 和 C 节点 则 会 从 自己 的 子 节点 中 ( 极 大 值 节点 ) 选择 评估 值 最 小 的 一 个 节点 。 假 设 已 经 对 也 节 
点 完成 了 搜索 ，B 的 四 个 子 节 点 D、E、F、G 中 最 小 值 是 2， 则 可 知 B 节点 的 准确 估 值 是 2， 此 
时 更 新 a 的 值 为 2。 接 下 来 开始 搜索 C 节点 的 子 节点 再 、I 和 J， 如 果 瑟 节点 的 估 值 是 1， 则 说 明 
C 节点 的 评估 值 一 定 不 会 超过 1 ( 因为 C 总 是 选择 HH、I、J 节 点 中 的 最 小 值 )， 也 就 是 说 ，C 节点 
的 评估 值 一 定 不 会 比 B 节点 的 评估 值 更 大 ， 此 时 就 可 以 终止 对 C 节点 的 搜索 ， 此 过 程 就 称 为 “ua 
前 枝 ”。 

图 23-3 是 “B 剪 枝 ” 过 程 示意 图 。 极 小 值 节点 A 搜索 博弈 树 时 会 从 两 个 极 大 值 节点 B 和 C 
中 选择 评估 值 最 小 的 一 个 节点 ， 而 B 和 C 节点 则 会 从 自己 的 子 节点 〈 极 小 值 节点 ) 中 选择 评估 
值 最 大 的 一 个 节点 。 假设 已 经 对 B 节 点 完成 了 搜索 , B 的 四 个 子 节点 D、E、F、G 中 最 大 值 是 8， 
则 可 知 B 节点 的 准确 估 值 是 8， 此 时 更 新 B 的 值 为 8。 现 在 开始 搜索 C 节点 的 子 节点 再 、I 和 了 
如 果 瑟 节点 的 估 值 是 10， 则 C 节点 的 值 一 定 不 会 小 于 10 (因为 C 总 是 选择 朝 、I、J 节 点 中 的 最 
大 值 )， 也 就 是 说 ，C 节点 的 值 一 定 不 会 比 B 节点 更 小 ， 因 此 可 以 终止 C 节 点 的 搜索 ， 此 过 程 就 
称 为 “B 剪 校 ”。 
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极 大 值 节点 A 
CG 极 小 值 节点 


0=2 B C })B=1 


极 大 值 节点 


极 小 值 布 点 


SS 


图 23-3 “PB 剪 枝 ” 过 程 示意 图 


这 就 是 “a-B” 剪 校 算法 的 原理 ,搜索 开始 时 ,可 设 定 a=-%，B=+% ,在 搜索 过 程 中 ， 这 个 
范围 会 逐步 收 窗 ， 直 到 出 现 u>B 的 剪 校 条 件 。 下 面 我 们 就 给 出 基于 极 大 极 小 值 算法 的 “a-B” 剪 
枝 算法 的 伪 代 码 : 


int MiniMax AlphaBeta(node, depth, «, B, isMaxPlayer) 


if(depth == 0) 


{ 

return Evaluate(node); 
if(isMaxPlayer) 
{ 


for_each(node 的 子 节点 child_node) 


{ 
int value = MiniMax AlphaBeta(child node, depth - 1, «, B, FALSE); 
o= max(a, value); 
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if(o >= B) /*B 剪 枝 */ 


break; 
} 
return oa; 
} 
else 
{ 
for_each(node 的 子 节点 child_node) 
: int value = MiniMax AlphaBeta(child node, depth - 1, «, B, TRUE); 
B= min(B, value); 
if(o >= B) /*o 剪 枝 */ 
break; 
} 
return B; 
} 


、 


” 剪 枝 算法 同样 可 以 应 用 于 负极 大 值 算 法 ， 需 要 注意 的 是 ， 在 递归 搜索 子 节 点 时 ， 需 要 
大 B,-oj。 应 用 “o-B” 剪 枝 算 法 后 的 负极 大 值 算法 伪 代 码 如 下 所 示 : 


int NegaMax AlphaBeta(node, depth, «, B, color) 


{ 
if(depth == 0) 
{ 
return color * Evaluate(node); 
} 
int score = -INFINITY; 
for_each(node 的 子 节点 child_node) 
{ 
int value = -NegaMax AlphaBeta(child node, depth - 1, -B, -a, -color); 
score = max(score, value); 
o= Max(a, value); 
if(o>= B) 
break; 
} 
return score; 
} 


23.1.5” 估 值 函 数 


对 于 很 多 启发 式 搜索 算法 ,其 “智力 ”的 高 低 基 本 上 是 由 估 值 函数 (评估 函数 ) 所 决定 ， 棋 
类 游戏 的 博弈 树 搜索 算法 也 不 例外 。 博弈 树 搜 索 算法 基本 上 就 是 利用 计算 机 强大 的 数据 处 理 和 计 
算 能 力 进行 蛮 力 计算 ， 只 有 在 进行 棋局 评估 时 才 体 现 出 一 点 点 “智力 "， 这 点 “智力 ”就 是 佑 值 
函数 的 价值 。 人 类 的 棋 手 下 横 , 对 棋局 都 有 一 个 综合 评估 , 协调 各 个 棋子 之 间 的 关系 , 有 舍 有 得 ， 
控制 棋局 向 有 利 的 方向 发 展 。 但 是 对 于 计算 机 算法 来 说 , 把 这 一 套 整体 的 评估 和 控制 转化 成 一 个 
佑 值 函 数 ， 是 一 个 相当 复杂 的 模型 。 比 如 弃 子 是 棋 类 游戏 中 常用 的 策略 ， 以 退 为 进 ,在 若干 步 之 
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后 可 获得 很 好 的 结果 ， 如 何 让 评估 函数 也 能 理解 这 种 策略 ? 
估 值 函数 的 作用 是 把 一 个 棋局 量化 成 一 个 可 直接 比较 的 数字 , 这 个 数字 在 一 定 程度 上 能 反映 
取胜 的 概率 。 棋局 的 量化 需要 考虑 很 多 因素 ,量化 结果 是 这 些 因素 按照 各 种 权重 组 合 的 结果 。 这 
些 因素 通常 包括 棋子 的 战 力 ( 棋 力 )、 双 方 棋子 占领 的 空间 、 落 子 的 机 动 性 、 威 胁 性 ( 能 吃 掉 对 
方 的 棋子 )、 形 和 势 等 。 不 同 的 棋 类 游戏 会 根据 规则 选择 合适 的 参考 因素 与 权重 关系 ,组 合 出 一 
个 量化 的 评估 结果 。 权 重 关 系 组 合 在 很 大 程度 上 决定 了 估 值 函数 的 价值 , 为 了 获得 一 个 更 好 的 组 
合 关 系 ， 研 究 者 通常 会 收集 成 千 上 万 的 棋局 对 自己 的 估 值 函数 进行 “训练 "， 通 过 反馈 调整 权重 
组 合 关系 。 佑 值 函 数 对 棋局 量化 的 原理 通常 是 简单 的 ， 但 是 大 多 数 “ 战 力 强悍 ”的 AI 算法 都 是 
不 公开 自己 的 估 值 函数 的 。 

估 值 函数 并 不 仅仅 是 简单 的 评估 计算 ， 棋 类 游戏 的 估 值 函数 需要 综合 大 量 跟 棋 类 有 关 的 知 
识 。 相 关 的 知识 越 少 , 估 值 函数 越 简单 ， 速 度 快 但 是 效果 差 。 相 关 的 知识 越 多 , 估 值 函数 就 越 复 
杂 , 估 值 函 数 的 质量 高 但 是 速度 慢 。 估 值 算法 中 增加 的 知识 越 多 , 算法 就 越 慢 , 很 多 情况 下 都 需 
要 在 速度 和 质量 之 间 寻 求 一 种 平衡 。 


23.1.6 ”置换 表 与 哈 希 函 数 


置换 表 〈transposition table ) 也 是 各 种 启发 式 搜索 算法 中 常用 的 辅助 算法 ， 它 是 一 种 以 空间 
换 时 间 的 策略 ， 使 用 置换 表 的 目的 就 是 提高 搜索 效率 。 结 合 “a-B” 剪 枝 算法 ， 直 接 通过 置换 表 
可 以 获得 该 节点 的 一 个 已 经 缩小 范围 的 搜索 窗口 , 直接 在 这 个 搜索 窗口 上 进行 搜索 可 以 提高 前 枝 
的 效率 。 如 果 通 过 置换 表 可 以 得 到 该 节点 的 一 个 明确 的 搜索 结果 ( 通常 这 个 结果 是 当前 已 知 的 最 
好 结果 )， 则 可 直接 利用 这 个 结果 ， 没 有 必要 再 对 这 个 节点 进行 搜索 。 本 节 我 们 将 介绍 与 置换 表 
相关 的 一 些 知 识 。 

1. 置换 表 的 原理 

一 般 情 况 下 ,置换 表 中 的 每 一 项 代表 者 一 个 棋局 中 最 好 的 落 子 方法 , 直接 查找 置换 表 获 得 这 
个 落 子 方法 能 避免 耗 时 的 重复 搜索 ， 这 就 是 使 用 置换 表 能 大 幅 提高 搜索 效率 的 原理 。 
置换 表 用 于 存储 已 经 搜索 过 的 棋局 ( 包括 以 该 棋局 为 根 的 搜索 子 树 ) 的 搜索 结果 。 搜 索 算 法 
在 搜索 一 个 棋局 时 , 首先 查 置 换 表 ， 如 果 从 置换 表 中 能 查 到 这 个 棋局 的 信息 (已 经 完成 的 搜索 结 
果 )， 就 可 以 直接 使 用 这 些 信息 ， 从 而 避免 对 这 个 棋局 再 次 做 完整 搜索 。 置 换 表 的 每 个 表 项 包含 
与 该 棋局 有 关 的 搜索 信息 ， 这 些 信息 包括 评估 结果 、 搜 索 深 度 、 落 子 方 法 和 位 置 等 信息 。 

如 果 该 棋局 及 其 状态 子 树 已 经 完全 搜索 , 则 会 存储 该 棋局 的 精确 结果 ， 如果 该 棋局 及 其 状态 
子 树 还 没有 完成 搜索 ， 则 会 存储 已 经 完成 的 搜索 和 窗口。 使 用 “ao-B” 剪 枝 的 搜索 算法 通常 有 三 种 
不 同类 型 的 评估 值 ， 分 别 是 精确 值 、a 值 和 $B 值 。 精 确 值 ， 顾 名 思 义 ， 就 是 搜索 得 到 的 评估 结果 
落 在 区 间 [a, B] 之 内 ， 就 将 评估 结果 视 为 精确 值 。 如 果 状 态 子 树 的 所 有 子 节 点 没有 找到 比 当 前 极 
大 值 更 好 的 结果 ， 则 将 评估 结果 视 为 a 值 。 如 果 状 态 子 树 的 所 有 子 节点 没有 找到 比 当前 极 小 值 更 
差 的 结果 ， 则 将 评估 结果 视 为 B 值 。 
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搜索 深度 也 是 置换 表 中 的 一 个 重要 属性 , 它 决定 了 对 这 个 表 项 的 使 用 和 更 新 方式 。 假 如 要 对 
一 个 棋局 进行 n 层 深 度 的 搜索 ， 如 果 置 换 表 中 存在 一 个 搜索 深度 是 m， 且 m 大 n 的 表 项 , 则 说 明 
这 个 棋局 的 搜索 结果 可 以 直接 使 用 ， 无 需 对 该 棋局 再 做 完整 的 搜索 。 

除 此 之 外 ， 落 子 方法 和 位 置 用 于 指导 落 子 和 修改 棋局 状态 ， 也 是 很 重要 的 信息 。 

2. 哈 希 算法 
使 用 置换 表 最 大 的 问题 是 置换 表 的 组 织 和 查找 的 效率 。 一 般 来 说 ， 置 换 表 越 大 , 查找 的 命中 
率 就 越 高 。 但 这 个 关系 不 是 绝对 的 ， 当 置换 表 大 小 达到 一 定 规 模 后 ， 不 仅 不 会 再 提高 命中 率 ， 反 
而 会 因为 耗 时 的 查找 操作 影响 算法 的 效率 。 所 以 置换 表 不 是 越 大 越 好 ,需要 根据 计算 机 的 性 能 以 
及 搜索 的 深度 选择 一 个 合适 的 大 小 。 此 外 , 为 了 查找 操作 更 高 效 ， 通 常 都 会 用 可 直接 访问 的 哈 希 
表 方 式 组 织 置换 表 ， 险 希 函数 的 性 能 就 成 为 影响 置换 表 性 能 的 重要 因素 。 

棋 类 游戏 普遍 采用 Zobrist 哈 希 算法 ,在 本 书 的 第 20 章 已 经 介绍 过 Zobrist 哈 希 算法 的 原理 和 
实现 ， 本 童 在 介绍 黑白 棋 和 五 子 棋 的 搜索 算法 时 ， 会 再 次 用 到 Zobrist 哈 希 算法 。 


3. 置换 表 的 替换 原则 


置换 表 的 替换 原则 ， 也 称 覆 盖 策 略 ， 就 是 同一 个 棋局 (棋局 的 哈 希 值 相同 ) 如 果 有 了 更 新 的 
搜索 结果 ， 以 何 种 方式 更 新 置换 表 中 的 表 项 。 对 于 单一 的 置换 表 算 法 ， 其 替换 原则 一 般 有 两 种 ， 
一 种 是 深度 优先 替换 ( deeper priority )， 一 种 是 始终 ( 随时 ) 替换 (always replace )。 深 度 优先 蔡 
换 原则 执行 的 是 “同样 的 搜索 深度 或 更 深 时 和 替换 ”的 策略 ， 也 就 是 说 ， 只 有 新 棋局 的 搜索 深度 大 
于 或 等 于 置换 表 中 已 经 存在 的 值 时 , 才 更 新 置换 表 中 的 值 。 深 度 优先 策略 只 考虑 搜索 的 深度 , 没 
有 考虑 棋局 演化 出 的 新 棋局 信息 对 后 续 演 化 的 影响 , 置换 表 容 易 被 已 经 过 时 但 是 搜索 深度 很 深 的 
棋局 占 满 ， 无 法 保证 棋局 评估 结果 的 实时 性 ， 同 时 也 降低 了 置换 表 的 搜索 效率 。 始 终 蔡 换 原 则 就 
是 不 考虑 其 他 情况 ,如果 置换 表 中 存在 搜索 过 的 棋局 ,始终 用 新 的 搜索 结果 替换 已 经 存在 的 结 
始终 替换 策略 总 是 用 新 的 结果 代替 旧 的 结果 , 能 保证 棋局 评估 结果 的 实时 性 , 但 是 容易 丢掉 搜索 
层 数 较 深 的 棋局 评估 结果 ， 而 搜索 深度 越 深 ,往往 意味 着 更 优 的 评估 值 ( 对 很 多 搜索 算法 而 言 ， 
结果 往往 是 这 样 的 )。 

两 种 原则 各 有 优 缺 点 ,有 没有 一 种 能 将 二 者 结合 在 一 起 的 策略 呢 ? 很 多 研究 者 05005353 在 这 方面 
做 了 很 多 深入 的 研究 ,不 过 最 简单 、 也 是 最 常用 的 策略 就 是 使 用 双 置 换 表 。 简 单 来 说 ， 双 置换 表 
就 是 使 用 两 个 单 置换 表 ， 一 个 使 用 深度 优先 策略 ， 一 个 使 用 始终 替换 策略 。 查 表 时 每 次 查找 两 个 
表 ， 只 要 一 个 表 中 查 到 结果 就 可 以 直接 使 用 ， 如果 两 个 表 中 都 查 到 结果 ,就 根据 实现 制定 的 顺序 
策略 选择 其 中 一 个 。 更 新 的 时 候 ， 应 用 两 种 策略 分 别 对 两 个 置换 表 同 步 更 新 。 


当然 , 也 有 一 些 开源 的 棋 类 软件 使 用 了 分 类 置换 表 算法 , 就 是 同一 个 棋局 的 置换 表 对 应 多 个 
值 , 按照 搜索 深度 从 大 到 小 排序 , 每 当 更 新 一 个 棋局 时 ,将 新 的 搜索 结果 按 顺序 搬 和 人 到 对 应 的 位 
置 中 , 同时 删除 搜索 次 度 最 小 的 那个 结果 。 如 果 新 结果 的 搜索 次 度 小 于 当前 最 小 的 搜索 次 度 , 则 
直接 替换 当前 搜索 深度 最 小 的 结果 。 原 理 上 有 点 像 对 双 置 换 表 的 扩展 ， 将 其 扩展 成 了 层 置 换 表 ， 
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但 是 搜索 和 使 用 置换 表 的 方法 仍然 是 相同 的 。 


23.1.7 开局 库 与 终局 库 


俗话 说 :“ 好 的 开始 是 成 功 的 一 半 。” 棋 类 游戏 的 开局 尤其 如 此 。 如 果 能 在 开局 阶段 占据 先 机 ， 
对 整个 棋局 的 发 展 都 是 非常 有 利 的 。 终 局 又 称 残局 , 是 棋 类 游戏 中 决定 胜 负 的 最 后 阶段 ， 也 是 棋 
类 游戏 中 非常 重要 的 一 个 阶段 。 在 开局 和 终局 阶段 , 棋盘 上 的 变化 与 正常 进行 的 中 局 有 显著 的 不 
同 ， 比 如 棋子 的 数量 、 某 些 类 型 的 棋子 的 走 法 〈 比如 中 国 象棋 的 “ 兵 ” 和 “ 卒 ”) 都 会 发 生变 化 。 
很 多 棋 类 游戏 在 开局 和 终局 阶段 棋盘 上 的 棋子 很 少 ， 棋 类 游戏 AI 的 搜索 算法 在 面 对 空 荡 荡 的 棋 
盘 时 ,常用 的 启发 手段 基本 上 失效 , 搜索 算法 退化 为 普通 的 穷 举 搜 索 , 很 多 落 子 位 置 最 终 的 评估 
结果 都 是 一 样 的 ,搜索 算法 变 得 “不 知 所 措 ”, 也 正 是 这 个 原因 导致 许多 棋 类 游戏 的 AI 算法 在 开 
局 阶段 或 终局 阶段 常常 走出 令 人 匪夷所思 的 “ 昏 招 ”。 针 对 这 种 情况 ， 很 多 棋 类 游戏 的 算法 都 会 
使 用 开局 库 和 终局 库 , 在 开局 和 终局 阶段 ， 直接 从 库 中 搜索 已 知 的 开局 和 残局 走 法 ,借鉴 各 种 经 
典 的 和 成 熟 的 开局 走 法 ,利用 前 人 对 弈 的 智慧 度 过 这 个 阶段 。 到 进入 中 局 时 ,棋盘 上 的 棋子 比较 
多 ， 在 搜索 过 程 中 可 以 利用 各 种 启发 式 搜索 获取 千变万化 的 棋局 的 评估 结果 时 再 使 用 搜索 算法 。 


所 谓 的 开局 库 和 终局 库 实 际 上 就 是 一 种 存储 了 各 种 开局 和 终局 棋局 信息 的 数据 库 。 以 开局 库 
为 例 ， 库 中 存储 了 很 多 已 知 的 经 典 开 局 ， 都 是 一 些 很 有 规律 的 定 势 。 棋 类 游戏 的 AI 在 对 弈 的 开 
台阶 段 都 从 开局 库 中 搜索 落 子 方法 , 直到 棋局 演化 的 局 面 无 法 在 开局 库 中 找到 对 应 的 落 子 方法 为 
止 , 此 时 算法 才 开 始 真正 的 搜索 。 开 局 库 一 般 都 存 些 什么 内 容 呢 ? 开局 库 一 般 要 存储 开局 的 棋局 ， 
该 棋局 对 应 的 各 种 走 法 和 评估 分 数 , 有 些 开局 库 还 统计 了 该 开局 最 终 的 胜局 次 数 、 平 局 次 数 和 负 
局 次 数 ， 给 出 开局 棋局 的 权重 等 附加 信息 供 搜索 时 选择 。 

终局 决定 了 一 盘 棋 的 胜 负 ,终局 中 也 有 很 多 规律 和 定 势 ,许多 棋 类 游戏 算法 也 会 使 用 终局 库 ， 
以 便 在 终局 阶段 借鉴 一 些 经 典 的 走 法 。 相 对 于 局 面 简单 的 开局 库 ， 终 局 库 棋 子 没 有 固定 的 位 置 ， 
走 法 更 为 多 样 化 ,棋局 的 变化 更 无 常 ， 因 此 终局 库 的 规模 常常 是 开局 库 的 几 百 或 几 万 倍 ,， 检索 时 
间 比 较 长 ， 效 率 比 较 低 ， 需 要 根据 实际 需要 酌情 使 用 。 


23.2 ” 井 字 棋 一 一 最 简单 的 博弈 游戏 


井 字 棋 游戏 在 西方 又 被 称 为 Tic-Tac-Toe, 是 一 种 简单 的 九宫 格 游戏 , 因 其 棋盘 很 像 汉字 的 “着” 
字 而 得 名 。 井 字 棋 游戏 玩法 是 在 3 x 3 的 9 个 方 格子 棋盘 上 ， 两 人 持 不 同 颜色 的 棋子 交替 沙子 ， 
谁 的 棋子 在 横 、 竖 和 交叉 方向 先 连 成 3 个 就 算 获 胜 。 在 2.1 节 我 们 介绍 了 棋 类 游戏 的 AI 算法 相关 
的 一 些 理论 和 算法 设计 ,本 节 我 们 就 结合 这 个 井 字 棋 游戏 设计 一 个 简单 的 人 机 博弈 游戏 。 虽 然 简 
单 , 但 是 包含 了 一 个 棋 类 游戏 需要 解决 的 基本 问题 ， 比 如 棋盘 和 棋子 状态 建 模 、 博 弈 树 搜索 算法 
设计 、 静 态 棋局 评估 函数 和 如 何 产生 井 字 棋 的 走 法 ( 落 子 方法 ) 等 。 

通过 一 个 简单 的 估 值 函数 加 上 博弈 树 搜索 就 使 计算 机 具备 了 与 人 玩 井 字 棋 游戏 的 能 力 , 虽然 
智力 不 高 ， 但 是 计算 机 确实 是 在 玩 井 字 棋 游戏 ， 来 看 看 怎么 做 吧 。 
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23.2.1 棋盘 与 棋子 的 数学 模型 


井 字 棋 的 棋盘 是 3 x 3 的 九宫 格 ， 比 较 容 易 想到 用 一 个 3 x 3 的 二 维 数组 表示 棋盘 ， 而 数组 的 
值 就 是 棋盘 上 棋子 的 状态 。 使 用 二 维 数组 的 好 处 是 数据 访问 比较 直观 , 二 维 数组 的 两 个 下 标 可 以 
直接 表示 棋子 的 位 置 。 但 是 使 用 二 维 数组 的 缺点 也 是 明显 的 , 首先 是 遍历 棋盘 需要 用 两 重 循环 处 
理 两 个 下 标 , 其 次 是 判断 行 、 列 以 及 斜 线 方向 上 是 否 满足 三 子 一 线 的 算法 不 统一 , 根据 行 、 列 和 
和 斜 线 的 下 标 变 化 特点 ， 需 要 用 几 套 不 同 的 方法 处 理 。 现 在 换个 思路 , 用 长 度 为 9 的 一 维 数组 表示 
3 x3 的 棋盘 如 何 ? 这样 做 损失 的 是 数据 访问 的 直观 性 ， 比如 第 一 行 第 一 个 模 盘 格 ， 对 应 的 数据 
存在 数组 的 第 四 个 元 素 中 。 但 是 使 用 一 维 数组 的 好 人 处 是 处 理 数据 简洁 ,只 需 对 数组 一 维 遍历 就 可 
以 得 到 棋盘 的 当前 状态 , 不 需要 关注 两 个 下 标的 计算 , 最 重要 的 是 , 结合 一 点 小 技巧 可 以 用 一 套 
统一 的 算法 非常 简洁 地 处 理 上 面 提 到 的 判断 三 子 一 线 的 问题 。 

有 了 棋盘 和 棋子 的 状态 ， 加 上 当前 落 子 的 玩家 ID ， 即 可 构成 一 个 棋局 在 某 一 时 刻 的 状态 。 
以 下 就 是 棋局 状态 的 定义 : 


class GameState 


Evaluator *m evaluator; 
int m playerId; 
int m board[BOARD CELLS]; 


}; 

m_evaluator 是 评估 算 子 ， 是 对 棋局 估 值 的 委托 算 子 ， 已 不 属于 棋局 状态 ， 但 是 从 代码 实 现 角 
度 理 解 ， 可 以 作为 棋局 对 象 的 一 个 属性 。m board[i] 的 值 有 两 种 状态 ， 即 空 的 状态 和 有 棋子 的 状 
态 。 空 状态 时 其 值 是 PLAYER_NULL， 有 棋子 的 状态 时 其 值 是 玩家 的 ID ， 所 以 m_board[i] 的 值 可 能 
为 PLAYER_NULL、PLAYER_A 或 PLAYER_B 三 种 情况 。 


以 上 就 是 棋局 状态 的 数据 结构 定义 ,现在 来 看 看 前 文 提 到 的 判断 三 子 一 线 的 小 技巧 。 观 察 井 
字 棋 游戏 的 棋盘 ,能 够 排 成 三 子 一 线 的 情况 一 共有 三 横 、 三 竖 加 两 条 斜 交 义 线 8 种 情况 ,我 们 事 
先 把 这 8 种 情况 的 数组 下 标 组 织 成 一 个 表 : 


int line idx tb][LINE DIRECTION][LINE CELLS] = 


oo 


{0，1，2}，// 第 一 行 
{3，4，5}，// 第 二 行 
{6，7，8}，// 第 三 行 
{0，3，6}，// 第 一 列 
{TE 4， 7}, // 第 二 列 
{2，5，8}，// 第 三 列 
{0，4，8}，// 正 交叉 线 
{2，4，6}，// 反 交叉 线 


;3 
这 样 在 判断 三 子 一线 时 , 不 需要 做 复杂 的 数组 下 标 计算 ,直接 查 这 张 表 就 可 以 依次 判断 8 条 
线 上 是 否 有 三 子 一线 的 情况 。Gamestate 类 中 判断 三 子 一 线 的 算法 就 是 这 么 实现 的 : 


bool GameState::CountThreeline(int player id) 
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for(int i = 0; i < LINE DIRECTION; i++) 
{ 


if( (m board[line idx tbl[i][0]] 


&& DT [A 
&& (m board[line idx tbl[i][2]] 


{ 


return true; 
} 


return false; 


这 就 是 算法 设计 中 常用 的 用 数据 表 进 行 一 致 性 处 到 
这 种 技巧 。 使 用 精心 构造 的 数据 表 ， 可 以 让 很 多 棘手 的 问题 的 实现 代码 变 得 无 比 简单 。 


23.2.2” 估 值 函数 与 估 值 算法 


player_id) 


player_id) 
player_id) ) 


的 技巧 , 在 本 书 的 其 他 章节 中 也 多 次 用 到 


研究 井 字 棋 游 戏 的 估 值 函数 , 需要 理解 井 字 棋 游 戏 的 一 些 棋 局 现象 。 首先 是 空 行 数 的 概念 ， 


所 谓 棋 子 占据 的 空 行 数 ， 指 的 是 棋子 所 在 的 行 、 列 或 斜 线 方向 上 只 有 己方 的 棋子 或 空格 子 的 行 


( 列 、 斜 线 ) 数 + 全 是 空格 的 行 ( 列 、 斜 线 ) 数 。 如 图 23-4 所 示 ， 第 一 个 棋局 中 和 棋 


子 的 空 行 


数 是 5，O 棋子 的 空 行 数 是 4， 第 二 个 棋局 中 和 X 棋子 的 空 行 数 是 4，O 棋子 的 空 行 数 是 3。 根据 


对 并 字 棋 游戏 规则 的 理解 ， 对 于 一 个 井 字 棋 


的 棋局 ， 每 个 玩家 的 棋子 占据 的 空 行 越 多 ， 就 说 明 


该 玩家 有 更 大 的 可 能 性 凑 成 三 子 一 线 的 结果 ， 因 此 空 行 数 是 井 字 棋 游戏 估 值 函数 评估 棋局 的 一 


个 重要 因素 。 


但 是 井 字 棋 游戏 的 评估 并 不 是 只 考虑 空 行 数 这 一 个 因素 , 在 某 些 情况 下 , 一方 棋子 占据 的 空 
行 数 多 并 不 一 定 说 明 局 面 占 优 势 ， 因 为 井 字 横 游戏 还 存在 了 双 连 子 的 情况 。 所 谓 的 双 连 子 , 指 的 


是 在 一 行 ( 列 、 斜 线 ) 上 有 两 个 已 方 的 棋 


子 而 没有 对 方 的 棋子 的 情况 。 如 图 23-4 的 第 二 个 棋局 ， 


O 的 棋子 形成 了 双 连 子 而 XX 的 棋子 不 是 双 连 子 。 在 这 种 情况 下 ， 尽 管 XX 棋子 的 空 行 数 比 O 棋子 


的 空 行 数 多 ,但 是 O 棋子 形成 了 双 连 子 ， 比 和 棋子 更 有 优势 。 


已 


3 


~ 


> 


O| 
~ 


(1) 


(2) 


图 23-4” 井 字 棋 局 面 示意 图 


综 上 考虑 ， 我 们 给 出 了 一 种 井 字 棋 游 戏 的 佑 值 函 数 计算 方法 ， 对 于 执 X 棋子 的 一 方 来 说 ， 


平 佑 洱 数 是 : 


Y 
/i 
所 
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十 co 

0 

0 

(X 双 连 子 数 -O 观 车子 数 ) x10+(X 空 行 数 -0 空 行 数 ) 


ECO= 


+% 表 示 XX 获胜 的 局 面 ，-% 表 示 X 失 败 的 局 面 ，0 表示 双方 是 平局 ， 其 他 值 是 具体 的 评估 
值 。 根 据 这 个 估 值 函数 ， 我 们 设计 了 FeEvaluator 算 子 ， 以 下 是 FeEvaluator 算 子 估 值 函数 的 
算法 实现 : 


int FeEvaluator::Evaluate(GameState& state, int max player id) 


int min = GetPeerPlayer(max player id); 


int aOne, aTwo, aThree, bOne, bTwo, bThree; 
CountPlayerChess(state, max player id, aOne, aTwo, aThree); 
CountPlayerChess(state, min, bOne, bTwo, bThree); 


if(aThree > 0) 
return INFINITY; 

} 

if(bThree > 0) 


return -INFINITY; 
} 


return (aTwo - bTwo) * DOUBLE WEIGHT + (aOne - bone); 
} 
井 字 棋 游戏 的 估 值 算法 很 多 ， 有 很 多 网 友 也 提供 了 其 他 方法 , 在 本 章 的 随 书 代码 中 ,还 用 另 
一 种 方式 实现 了 一 个 WzEvaluator 算 子 ， 经 过 测试 ， 两 个 评估 算 子 的 棋 力 差不多 。 


23.2.3 ”如 何 产生 走 法 〈 落 子 方法 ) 


搜索 算法 负责 对 棋局 进行 评估 , 选择 下 一 步 的 最 佳 落 子 位 置 , 但 是 搜索 过 程 中 需要 遍历 所 有 
可 能 的 棋子 落 子 或 移动 方法 , 这 就 需要 一 种 能 够 推动 落 子 或 棋子 移动 的 算法 。 棋 类 游戏 的 规则 多 
种 多 样 ， 有 的 只 能 放置 棋子 ,不 能 移动 棋子 ， 有 的 只 能 移动 已 有 的 棋子 ， 因 此 走 法 产生 算法 也 是 
多 种 多 样 的 ,很 难 找到 通用 的 算法 。 井 字 棋 游戏 的 走 法 产生 非常 简单 ， 就 是 对 9 个 空格 中 还 没有 
放置 棋子 的 格子 依次 进行 落 子 试探 即 可 ,所 有 空格 子 都 试 过 以 后 , 走 法 产生 的 算法 就 结束 了 , 非 
常 简单 。 

走 法 产生 算法 一 般配 合 搜索 算法 , 成 为 搜索 算法 的 一 部 分 。 下 面 我 们 就 给 出 井 字 棋 游 戏 的 极 
大 极 小 值 搜索 算法 实现 , 内 含 了 走 法 产生 , 结合 23.1.2 的 算法 解释 , 这 段 代码 不 难 理解 。MiniMax() 
函数 就 是 极 大 极 小 值 搜索 算法 的 实现 , 其 中 的 for 循环 就 是 走 法 产生 算法 。 为 了 配合 23.1 节 的 内 
容 ， 井 字 棋 游戏 还 实现 了 带 “o-B” 剪 枝 的 搜索 算法 AlphaBetaSearcher 和 负极 大 值 搜索 算法 
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NegamaxSearcher， 有 兴趣 的 读者 可 以 查看 本 章 的 随 书 代码 ， 了 解 这 两 种 搜索 算法 的 实现 细节 。 通 
过 对 比 ,“o-B” 剪 枝 算法 对 提高 搜索 效率 方面 确实 有 非常 好 的 效果 。 对 于 空 盘 状态 的 棋局 ， 假 如 
设置 搜索 深度 是 6, 极 大 极 小 值 搜索 算法 搜索 棋局 的 次 数 是 65000 多 次 ,但 是 应 用 “o-B” 剪 枝 后 
搜索 棋局 的 次 数 只 有 6500 多 次 。 


int MinimaxSearcher: :MiniMax(GameState& state, int depth, int max_player id) 


{ 


if(state.IsGameOver() || (depth == 0)) 


{ 
return state.Evaluate(max player id); 
} 
int score = (state.GetCurrentPlayer() == max player id) ? -INFINITY : INFINITY; 
for(int i = 0; i < BOARD CELLS; i++) 
{ 


GameState tryState = state; /* 生 成 临时 棋局 状态 对 象 */ 
if(tryState.IsEmptyCell(i))/* 此 位 置 可 以 落 子 */ 


{ 
tryState.SetGameCell(i, tryState.GetCurrentPlayer()); 
tryState. Switchplayer(); 
int value = MiniMax(tryState, depth - 1, max_player id); 
if(state.GetCurrentPlayer() == max_player id) 
{ 
score = std::max(score, value); 
} 
else 
{ 
score = std::min(score, value); 
} 
} 


return score; 


} 

实现 了 搜索 算法 和 评估 算 子 ,结合 专 为 本 书 而 做 的 一 个 棋 类 游戏 代码 框架 ( 参见 附录 B )， 
就 可 以 实现 一 个 简单 的 人 机 对 战 井 字 棋 游 戏 ( 如 图 23-5 所 示 )。 来 看 看 结果 吧 ， 设 定 搜索 深度 为 
6 的 时 候 ， 计 算 机 的 智商 貌似 不 错 ， 我 最 多 只 能 玩 个 平局 。 
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co CG\WINDOWS\system32\cmd.exe 


MinimaxSearcher 6561 Cwith flpha-Beta)> 


Computer play at [2 . 2] 
Current game state : 


Please select your position 《row = 1-3.col = 1-3?: 11 


Current game state : 


MinimaxSearcher 435 《with flpha-Beta> 


Computer play at [1 . 3] 
Current game state : 


Please Select youk position 《kow = 1-3-.col = 1-3?: 3 1L 


Current game state : 


MinimaxSearcher 23 Cwith flpha-Beta» 
Computer plavy at [2 。 1] 
Current game state : 


23.3 ”奥赛 罗 棋 (黑白 棋 ) 


简单 的 井 字 棋 游 戏 
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奥赛 罗 棋 (Othello ) 又 称 黑白 棋 、 翻 转 棋 ( Reversi )， 在 西方 和 日 本 非常 流行 。 游 戏 双方 分 
别 执 黑 白 两 种 颜色 的 棋子 , 在 8 x 8 的 棋盘 上 轮流 落 子 ， 相互 翻 转 对 方 的 棋子 。 只 要 落 子 和 棋盘 
上 任 一 枚 己方 的 棋子 在 横 、 坚 和 和 斜 方向 上 能 夹 住 对 方 棋子 ， 


就 不 容易 了 。 


棋子 。 如 果 一 方 在 任 一 位 置 落 子 都 不 能 夹 住 对 手 棋 子 ， 
则 游戏 结束 ， 棋 盘 上 棋子 多 的 一 方 取胜 。 奥 赛 罗 棋 


为 了 便于 识别 棋子 的 位 置 ， 用 数字 1 ~ 8 标识 棋盘 的 行 ， 
23-6 所 示 。 黑 日 棋 游 戏 的 规则 比较 特殊 ， 有 时 修一 个 落 子 就 会 造成 十 几 个 子 的 翻转 ,因此 很 容易 


游戏 规则 简 


就 能 将 对 方 的 这 些 棋子 转变 为 己方 


出 现 双 方 比分 剧烈 变化 的 情况 。 即 使 在 游戏 的 六 


几 个 回合 就 能 将 对 方 大 量 的 棋子 翻转 为 己方 棋 
太 着 眼 于 子 的 多 少 ,更 重要 的 是 棋子 的 位 置 。9 


共 四 个 方向 上 都 可 能 被 夹击 。 边 缘 的 棋子 则 只 


之 说 。 


角 上 的 棋子 则 完全 不 可 能 被 夹击 ， 是 最 安全 的 位 置 。 


子 , 从 而 扭转 局 


就 要 让 对 手下 子 ， 如果 双 方 丝 不 能 落 子 ， 
单 ， 很 容易 上 手 ,但 是 要 玩 得 好 


用 字母 A ~H 标识 棋盘 的 列 ， 如 图 


1 期 不 占 优势， 只 要 占据 了 有 利 位 置 , 后 期 很 可 能 


势 。 因 此 黑 日 棋 游 戏 的 前 


P 间 位 置 的 棋子 最 容易 受到 夹击 ,在 横 、 


其 一 般 不 
竖 和 斜 线 


4 有 一 个 可 能 被 夹击 的 方向 〈 横 向 或 竖 癌 )， 而 四 个 


正 因为 这 样 ， 黑 白 棋 有 “人 金 角 银 边 草 肚皮 ” 
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C 位 (C-squares )、 星 位 (X-squares )、 角 和 边 是 黑白 
棋 中 的 一 些 特殊 的 位 置 。 在 图 23-6 中 标记 了 字母 C 的 A2、 
A7、B1、B8、G1、G8、H2 和 7 几 个 位 置 即 为 C 位 ， 标 
记 了 字母 X 的 B2、B7、G2 和 G7 四 个 位 置 即 为 星 位 。 下 
棋 过 程 中 不 到 万 不 得 已 不 要 占用 C 位 和 星 位 ， 因 为 对 手 可 
能 会 借助 C 位 和 星 位 的 已 方 棋 子 做 桥梁 占领 相 邻 的 角 位 
置 。 与 C 位 相 比 ， 星 位 的 危害 更 大 ， 因 为 星 位 上 如 果 落 了 
己方 的 棋子 ， 对 手 就 可 以 从 5 个 方向 攻击 相 邻 的 C 位 和 角 
位 置 。 标 记 了 字母 E 的 是 边 位 置 ， 这 些 位置 相 对 不 容易 受 
到 攻击 ,下 横 过 程 中 应 考虑 优先 落 子 在 这 些 位 置 。 与 之 对 
比 的 与 边 相 邻 的 标记 了 字母 S 的 位 置 ， 这 些 位 置 容易 导致 
对 手 占领 边 位 置 ， 因 此 下 棋 时 尽量 不 要 落 在 这 些 位 置 。 

除了 这 四 个 位 置 ,黑白 棋 中 还 有 几 个 重要 的 概念 ,比如 内 部 子 ( internal discs )、. 边 缘 子 ( external 
discs )、 稳 定子 ( stable discs ) 和 行动 力 (mobility ) 等 。 不 与 空位 相 邻 的 棋子 被 称 为 内 部 子 ， 与 
之 相对 的 就 是 边缘 子 。 当 对 手 落 子 时 ,边缘 子 就 是 直接 被 夹击 的 对 象 ， 内 部 子 相 对 好 一 些 ， 边缘 
子 和 内 部 子 都 是 考察 一 个 黑白 棋局 面 的 重要 参考 要 素 , 没有 内 部 子 的 局 面 通常 是 个 糟糕 的 局 面 ， 
边缘 子 太 多 同样 糟糕 。 在 棋盘 上 绝对 不 会 被 翻转 的 棋子 就 是 稳定 子 ， 稳 定子 越 多 ， 局 面 越 有 利 ， 
四 个 角 位 置 上 的 棋子 就 是 天 然 的 稳定 子 。 一 般 来 说 ， 黑 白 棋 的 前 20 手 一 般 不 会 出 现 稳定 子 ， 所 
以 有 一 些 黑 白 棋 估 值 理论 通常 在 黑白 棋 开 局 的 时 候 不 考虑 稳定 子 的 因素 。 最 后 是 行动 力 的 概念 ， 
行动 力 是 指 合法 的 落 子 位 置 的 数量 ， 当 一 方 拥 更 多 的 合法 落 子 位 置 可 供 选 择 时 ,就 意味 着 其 具有 
更 好 的 行动 力 。 


23.3.1 棋盘 与 棋子 的 数学 模型 


白 棋 的 棋盘 是 8 x 8 个 格子 , 很 容易 联想 到 用 二 维 数组 来 表示 棋盘 和 棋子 状态 。23.2.1 节 介 
绍 井 字 棋 游戏 时 ,已 经 提 到 过 使 用 二 维 数 组 虽然 展示 更 直观 一 些 , 但 是 在 横向 、 竖 向 和 和 斜 线 方向 
搜索 棋子 状态 时 会 遇 到 算法 不 一 致 问题 的 困扰 , 因此 对 于 黑白 棋 的 棋盘 和 棋子 状态 , 我 们 仍然 使 
用 一 维 数组 来 建 模 。 黑 白 棋 游戏 比 井 字 棋 游戏 复杂 很 多 ， 有 更 多 的 规则 需要 判断 , 使 用 一 维 数组 
为 棋盘 和 棋子 状态 建 模 ， 需 要 很 多 技巧 。 本 节 我 们 不 另辟蹊径 ,直接 借用 Warren Smith 提出 的 一 
种 建 模 方法 PC ， 接 下 来 我 们 就 详细 介绍 一 下 Warren Smith 提出 的 棋盘 与 棋子 模型 。 

1. Warren Smith 棋盘 状态 模型 


Warren Smith 的 模型 使 用 一 个 长 度 为 91 的 一 维 数组 表示 黑白 棋 的 棋盘 与 棋子 状态 ， 其 中 64 
个 是 棋盘 上 的 位 置 ，27 个 是 标志 位 或 哨兵 位 。91 个 数组 元 素 中 前 10 个 和 后 10 个 是 标志 位 ， 中 
间 每 间隔 8 个 位 置 插入 一 个 标志 位 ， 这 个 模型 各 个 位 置 的 逻辑 结构 如 下 阵列 所 示 : 


ddddddddd 
dxxxxxxxx 10 


ey 


图 23-6 ”黑白 棋 棋 盘 位 置 示 意图 


23.3 奥赛 罗 棋 (黑白 棋 ) 二 375 


dxxxxxxxx 19 
dxxxxxxxx 28 
dxxxxxxxx 37 
dxxxxxxxx 46 
dxxxxxxxx 55 
dxxxxxxxx 64 
dxxxxxxxx 73 
dddddddddd 


字母 d 标 识 的 就 是 标志 位 ， 用 特殊 值 DUMMY 表示 ,x 是 棋子 状态 ,我 们 的 算法 用 PLAYER_A 
和 PLAYER_B 分 别 表示 双方 的 棋子 ， 用 PLAYER_NULL 表示 空位 置 。 一 般 人 会 觉得 应 该 用 标志 d 把 整 
个 棋盘 都 框 起 来 ,， 这 相当 于 在 每 8 个 棋盘 位 置 中 间 插 入 两 个 标志 位 ， 其 实 没 有 这 个 必要 , 一 个 标 
志 位 就 是 以 保证 在 任意 一 个 x 位 置 向 8 个 方向 搜索 都 能 遇 到 标志 位 而 正常 结束 ,如果 你 还 有 疑问 ， 
看 完 下 面 对 方向 步 进 数 组 的 介绍 后 就 能 明白 这 样 设置 标志 位 的 原因 了 。 

井 字 棋 游 戏 比 较 简 单 ， 我 们 介绍 的 算法 用 一 个 表 预 置 了 8 个 行 、 列 和 和 斜 线 的 方向 , 但 是 这 个 
方法 不 适用 于 黑白 棋 ， 因 为 黑白 棋 的 行 、 列 和 和 斜 线 的 组 合 太 多 了 。 尽 管 如 此 ,我 们 还 是 有 办 法 避 
免 像 二 维 数组 那样 需要 分 别 用 行 和 列 的 下 标 步 进来 处 理 各 种 方向 ， 其 窍门 就 是 使 用 方向 步 进 数 
组 。 对 于 任意 一 个 x 位 置 ， 向 右 搜索 意味 着 每 次 x 的 下 标 +1， 问 左 搜索 意味 着 每 次 x 的 下 标 -1， 
向 上 搜索 意味 着 每 次 x 的 下 标 -9， 向 下 搜索 意味 着 每 次 x 的 下 标 +9。 斜 线 方向 也 是 一 样 ,最 终 的 
方向 步 进 数 组 可 以 定义 为 : 

const int dir inc[] = {1, -1, 8, -8, 9, -9, 10, -10}; 

现在 明白 了 吧 , 对 于 上 述 阵列 ,用 这 个 不 仅 数 组 向 任意 一 个 方向 步 进 , 最 终 都 会 遇 到 标志 位 
而 自然 结束 ， 这 正 是 这 个 模型 的 高 明之 处 。 

现在 问题 是 ， 这 个 模型 中 的 元 素 与 实际 棋盘 上 的 行 和 列 的 坐标 如 何 换算 呢 ? 其 实 很 简单 ， 
就 是 : 

square(row, col) = board[10+col+rowx9] (0<= row,col <=7) 

有 了 这 个 关系 ， 就 不 难 将 棋盘 上 的 行 、 列 坐标 与 棋盘 模型 中 的 一 维 数组 元 素 对 应 起 来 了 。 

除了 棋盘 和 棋子 的 状态 , 黑白 棋 的 棋盘 上 空位 是 一 个 比较 重要 的 数据 , 黑白 棋 的 落 子 都 是 在 
空位 上 进行 的 。 虽然 可 以 搜索 棋盘 得 到 每 个 空位 的 位 置 , 但 这 不 是 一 种 高 效 的 做 法 。 通常 的 做 法 
是 用 一 个 列表 将 这 些 空位 组 织 起 来 , 在 搜索 算法 中 直接 使 用 这 个 空位 表 进 行 搜索 , 要 比 搜 索 整 个 
棋盘 得 到 这 些 空位 信息 要 快 很 多 , 特别 是 进入 中 局 阶段 以 后 ,空位 的 个 数 逐 渐 减 少 ,这 个 表 越 来 
越 小 , 这 种 组 织 方法 所 带 来 的 效率 提升 作用 就 更 明显 。 很 显然 , 在 搜索 过 程 中 这 个 表 将 面临 频繁 
的 插入 和 删除 操作 ， 因 此 我 们 使 用 双向 链表 来 组 织 这 个 空位 列表 ， 这 个 链表 定义 如 下 : 


typedef struct tagEMPTY_LIST 


int cell; 

tagEMPTY_LIST *pred; 

tagEMPTY_LIST *succ; 
}EMPTY_LIST; 
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其 中 cell 就 是 这 个 空位 在 一 维 棋盘 模型 数组 中 的 位 置 。 

2. Warren Smith 模型 示例 

这 一 节 , 我 们 用 一 个 判断 一 个 落 子 是 否 合法 的 算法 来 介绍 一 下 如 何 使 用 这 个 棋盘 模型 ,通过 
对 比 可 以 清楚 地 理解 这 个 模型 的 优点 。 落 子 是 否 合法 就 是 看 是 否 能 翻转 对 手 的 棋子 ， 只 要 在 8 个 
方向 上 的 任意 一 个 方向 上 能 翻转 对 手 的 棋子 即 为 合法 落 子 位 置 。 判断 一 个 方向 是 否 能 翻转 对 手 棋 
子 的 方法 是 : 首先 这 个 落 子 位 置 应 该 是 个 空位 ， 如果 在 这 个 方向 上 与 此 空位 相 邻 的 是 对 方 的 棋子 
则 党 着 这 个 方向 继续 搜索 , 直到 遇 到 的 棋子 不 是 对 方 的 棋子 为 止 。 如 果 此 时 遇 到 的 棋子 刚好 是 已 
方 的 棋子 , 则 说 明 在 这 个 搜索 方向 上 可 以 翻转 对 方 的 棋子 。 当 然 ,， 遇 到 的 这 个 棋子 也 可 能 是 另 一 
个 空位 置 或 哨兵 位 , 这 就 说 明 在 这 个 搜索 方向 上 不 能 翻转 对 方 的 棋子 。 下面 我 们 就 给 出 沿 一 个 方 
向 搜索 是 否 能 翻转 对 手 棋子 的 算法 : 


bool GameState::CanSingleDirFlips(int cell, int dir, int player id, int opp player id) 


int pt = cell + dir; 
if(m board[pt] == opp_player id) 


{ 
while(m board[pt] == opp_ player id) 
{ 
pt += dir; 
} 


return (m board[pt] == player id) ? true : false; 
} 


return false; 
} 
在 这 个 函数 参数 中 ，cel1 是 搜索 开始 的 空位 置 在 一 维 数组 中 的 位 置 ，dir 是 方向 步 进 值 ， 就 
是 dir_inc 数组 中 的 某 个 值 ，player_id 是 当前 落 子 的 玩家 ID (也 就 是 棋子 的 值 )，opp_player id 
是 对 手 的 棋子 的 值 。 算 法 原理 非常 简单 ，m board 的 下 标 pt 沿 着 dir 方向 步 进 ， 直 到 下 一 个 棋子 
不 是 opp_player_id 时 终止 步 进 ， 并 判断 这 个 棋子 是 否 是 player_id， 如 果 是 则 返回 true， 否 则 返 
回 false。 


沿 着 8 个 方向 分 别 搜索 ， 只 需要 用 CanSingleDirFlips() 函 数 依次 遍历 dir inc 数组 即 可 。 当 
然 ,并 不 是 所 有 的 位 置 都 需要 遍历 8 个 方向 ， 比 如 四 个 角 上 的 位 置 ， 就 只 需要 遍历 3 个 方向 ， 而 
边 上 的 位 置 则 只 需要 遍历 4 个 方向 。 为 了 提高 算法 效率 ，Warren Smith 的 模型 中 还 引入 了 一 个 方 
向 掩 码 表 ， 对 棋盘 模型 中 的 91 个 位 置 都 定义 与 之 对 应 的 方向 掩 码 。 方 向 掩 码 用 一 个 字 节 表示 ， 
这 个 字 节 中 的 每 个 比特 对 应 dir_inc 数组 中 的 一 个 方向 。 如 果 这 个 比特 是 1， 则 表示 相对 于 这 个 
位 置 来 说 这 个 方向 是 有 效 方向 ， 需 要 搜索 。 如 果 这 个 比特 是 0， 则 表示 这 个 方向 不 需要 搜索 。 最 
终 定 义 的 方向 掩 码 表 如 下 : 


unsigned char dir mask[BOARD CELLS] = 
{ 


0,0,0,0,0,0,0,0,0, 
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0,81,81,87,87,87,87,22,22, 
0,81,81,87,87,87,87,22,22, 
0,121,121,255,255,255,255,182,182, 
0,121,121,255,255,255,255,182,182, 
0,121,121,255,255,255,255,182,182, 
0,121,121,255,255,255,255,182,182, 
0,41,41,171,171,171,171,162,162, 
0,41,41,171,171,171,171,162,162, 
0,0,0,0,0,0,0,0,0,0 


» 
有 了 这 个 表 , 对 一 个 空位 完成 8 个 方向 搜索 的 算法 实现 就 非常 简洁 高 效 了 ,可 以 用 一 个 掩 码 
过 滤 掉 一 些 方向 。 请 看 CanFlips() 函 数 的 实现 : 


bool GameState::CanFlips(int cell, int player id, int opp player id) 
{ 


/* 在 8 个 方向 试探 ， 任 何 一 个 方向 可 以 翻转 对 方 的 棋子 就 返回 true*/ 
for(int i = 0; i < 8; i++) 
{ 

unsigned char mask = Ox01 << i; 

if(dir mask[cell] & mask) 


if(CanSingleDirFlips(cell, dir inc[i], player id, opp_player id)) 


return true; 
} 
} 
} 


return false; 


} 
23.3.2 ” 估 值 函数 与 估 值 算 ; 


黑白 棋 游 戏 有 很 多 可 用 于 佑 值 的 参数 , 除了 前 面 介绍 的 边 和 角 的 位 置 关 系 ,边缘 子 与 内 部 子 、 
PR 动力 等 几 个 概念 ， 还 有 前 沿 子 〈 潜在 行动 力 )、 棋 子 数 以 及 奇偶 性 等 因素 。 这 么 多 
参考 因素 是 否 都 需要 参 与 评估 ? 如 何 参 与 评估 ? 以 及 它们 在 最 后 的 估 值 中 占 的 比重 就 是 估 值 函 
数 设 计 的 重点 。 本 节 我 们 将 介绍 黑白 棋 游 戏 AI 中 常用 的 估 值 函数 模型 ， 以 及 我 们 最 后 所 用 的 估 
值 函数 算法 设计 。 
见 的 估 值 模型 

白 模 有 很 多 估 值 函数 模型 ，Gunnar Andersson 在 他 的 文章 “Writing an Othello program” 中 
提 到 了 三 种 常用 的 估 值 函数 模型 ， 分 别 是 基于 位 置 价值 表 的 估 值 模型 ( Disk-square tables )、 基 于 
行动 力 的 估 值 模型 ( Mobility-based evaluation ) 和 基于 模板 的 估 值 模型 ( Pattern-based evaluation )。 及 
首先 介绍 一 下 基于 位 置 价值 表 的 模型 ， 这 个 模型 的 着 眼 点 在 于 棋盘 上 每 个 位 置 都 有 不 同 的 价值 ， 
四 个 角 的 价值 最 高 , 与 角 相 邻 的 几 个 位 置 价值 最 低 ， 以 此 类 推 , 给 棋盘 上 的 每 个 位 置 都 定 一 个 价 
值 分 。 有 些 位 置 其 至 给 出 一 个 负 价 值 分 表示 惩罚 性 记分 ， 比 如 星 位 。 评 估 时 根据 每 个 棋子 所 在 的 


小 
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位 置 的 价值 分 求 和 , 给 出 评 佑 结果。 有 一 些 复杂 的 模型 其 至 在 棋局 的 不 同 阶 段 使 用 不 同 的 位 置 价 
值 表 ， 比 如 角 位 置 ， 其 在 开局 和 中 局 阶段 的 重要 性 要 比 终 局 阶段 要 高 。 单 纯 使 用 位 置 价值 表 忽 略 
了 太 多 黑白 棋 游戏 的 评估 因素 ， 算 法 的 AI 一 般 不 高 ， 当 然 ， 这 个 估 值 模型 的 优点 是 简单 。 

大 多 数 人 类 黑白 棋 棋 手下 棋 时 最 关注 的 就 是 已 方 的 行动 力 和 前 沿 子 数 量 , 棋 手 们 总 是 追求 最 
大 行动 力 和 最 少 前 沿 子 数 量 , 这 就 是 基于 行动 力 的 估 值 模型 的 理论 基础 。 当 然 , 有 一 些 基于 行动 
力 的 评估 模型 会 同时 考虑 边 和 角 的 关系 ， 并 在 游戏 的 早期 阶段 使 用 一 些 策略 避免 已 方 的 棋子 过 
多 ， 这 是 对 基于 行动 力 的 评估 模型 的 扩展 。 

行动 力 , 边沿 子 ( 潜在 行动 力 ) 和 稳定 子 是 黑白 棋 估 值 的 三 个 重点 参数 ,但 是 这 些 参数 的 计 
算 都 比较 复杂 ， 精 确 地 计算 这 些 参数 往往 影响 评估 的 速度 。 为 了 加 速 估 值 算法 ， 人 们 提出 了 基于 
模板 的 佑 值 模 型 。 模 板 估 值 模型 的 思想 是 将 全 局 的 行动 力 ， 边 沿 子 和 稳定 子 化 为 局 部 的 行动 力 ， 
边沿 子 和 稳定 子 ， 再 将 这 些 局 部 的 参数 组 合 来 表示 全 局 参数 。 每 个 局 部 包含 的 棋子 个 数 不 多 , 可 
以 预先 计算 好 , 这 样 在 最 终 佑 值 时 就 可 以 用 查 表 代替 计算 , 如 此 来 加 快速 度 。 以 Zebra 程序 为 例 ， 
它 将 一 个 8 x8 的 棋盘 ， 剪 切 成 13 种 不 同 的 模板 ， 每 种 模板 都 有 不 同 的 实例 ， 一 共有 46 种 不 同 
的 模板 实例 。 每 一 个 棋局 , 都 可 以 由 这 13 种 模板 得 到 的 46 个 不 同 的 模板 实例 对 棋局 进行 估 值 并 
相 加 而 得 到 总 的 估 值 。 那 么 这 46 个 模板 实例 (系数 值 ) 是 如 何 得 到 的 呢 ? 答案 就 是 用 大 量 的 棋 
局 进行 训练 。 具 体 如 何 定义 和 训练 模板 ， 请 参考 Michael Buro 的 文章 “Experiments with 
Multi-ProbCut and a New High-Quality Evaluation Function for Othello” 史 5， 此 处 不 再 歼 述 。 训 练 充 
分 的 好 模板 给 出 的 估 值 都 比较 精确 , 估 值 效果 与 直接 计算 这 三 个 参数 不 相 上 下 , 但 是 由 于 速度 快 ， 
可 以 进行 更 大 深度 的 搜索 ， 通 常 具 有 更 好 的 棋 力 。 

2. 估 值 函数 实现 

现在 该 讨论 我 们 的 估 值 函数 了 。 本 章 的 例子 不 追求 多 强 的 棋 力 ， 只 关注 算法 的 实现 ， 因 此 我 
们 采用 一 个 简单 的 评 佑 策略。 我 们 的 算法 根据 棋盘 上 空位 的 数量 ,将 棋局 粗略 地 分 为 开局 、 中 局 
和 终局 三 个 阶段 。 当 棋盘 上 的 空位 大 于 40 个 时 ,被 认为 是 开局 阶段 ， 因 为 此 阶段 棋盘 上 的 棋子 
比较 少 ， 可 参考 的 位 置 因素 影响 不 大 ， 此 阶段 的 评估 只 考虑 行动 力 因 素 。 当 棋盘 上 的 空位 大 于 
18 且 小 于 40 时 ， 被 认为 是 终局 阶段 ， 这 个 阶段 开始 考虑 棋子 在 棋盘 上 的 位 置 估 值 ， 同 时 结合 行 
动力 进行 评估 , 二 者 的 评估 系数 分 别 是 2 和 7。 当 棋盘 上 的 空位 小 于 18 个 时 , 被 认为 是 终局 阶段 ， 
此 时 除了 考虑 位 置 估 值 和 行动 力 之 外 , 还 考虑 对 棋子 数量 进行 评估 , 但 是 会 给 棋子 数量 一 个 比较 
低 的 评估 系数 。 

行动 力 可 以 理解 为 一 方 可 落 子 的 位 置 数量 , 计算 行动 力 就 是 遍历 所 有 空位 置 , 考察 每 个 空位 
置 是 否 是 合法 的 落 子 位 置 (能 翻转 对 手 的 棋子 )。23.3.1 节 已 经 给 出 了 判断 一 个 空位 是 否 能 落 子 
的 算法 ， 计 算 行动 力 的 算法 可 以 简单 实现 如 下 : 


int GameState::CountMobility(int player id) 


{ 
int opp_player id = GetPeerPlayer(player id); 
int mobility = 0; 
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for (EMPTY_LIST *em = m EmHead.succ; em != NULL; em = em->succ ) 
{ 
if(CanFlips(em->cell, player id, opp_player id)) 
mobility++; 
} 
} 
return mobility; 


} 
m_EmHead 是 空位 链表 的 头 节 点 ， 通 过 m_EmHead 遍历 空位 列表 ， 调 用 canFlips() 函 数 判 断 每 个 


进入 中 局 时 需要 计算 棋子 位 置 的 价值 ， 我 们 根据 国外 的 资料 整理 了 一 个 棋子 位 置 的 价值 表 ， 
如 下 所 示 : 


int posValue[BOARD CELLS] = 


{ 
0,0,0,0,0,0,0,0,0, 
0,100, -8， 10， 5, 5, 10, -8, 100, 
0,-8, -45， 1， 1 1， 1, -45, -8， 
0,10,， 1 3 ?2, 2, 3, 1, 10, 
0,5,， 1 2, 1 1 2, 1, 3, 
0,5,， 1 2, 1 1, 2, 1, 3, 
0,10,， 1 3, 2, 2, 3, 1, 10, 
Od J Ly Hy SAB 3 
0,100， -8， 10， 5， 5, 10, -8，100， 
0,0,0,0,0,0,0,0,0 

}; 


角 位 我 们 给 出 了 100 的 高 分 ， 与 之 对 应 的 是 星 位 ， 我 们 给 出 -45 的 每 罚 性 价值 分 ，C 位 也 是 
人 负 价值 分 , 目的 是 降低 位 置 评估 分 , 使 得 搜索 算法 避免 落 子 到 这 些 位 置 。 有 了 这 个 表 , 计算 棋子 
位 置 价值 的 算法 就 非常 简单 了 ,遍历 、 求 和 即 可 。 


int GameState::CountPosValue(int player id) 


, int value = 0; 
for(int i = 0; i < GAME CELLS; i++) 
| if(m board[i] == player id) 
value += posValue[i]; 
} 
return value; 


最 后 是 完整 的 估 值 函数 实现 ， 其 中 的 系数 并 不 是 最 优 值 ， 最 好 多 找 一 些 棋 局 进行 估 值 计算 ， 
并 根据 反馈 调整 这 些 系数 ， 以 期 获得 更 好 的 效果 。 


int WzEvaluator::Evaluate(GameState& state, int max player id) 
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{ 
int min = GetPeerPlayer(max player id); 
int empty = state.CountEmptyCells(); 


int ev = 0; 
if(empty >= 40) /* 只 考虑 行动 力 */ 
{ 


ev += (state.CountMobility(max player id) - state.CountMobility(min)) * 7; 


else if((empty >= 18) 8& (empty < 40)) 


{ 
ev += (state.CountPosValue(max player id) - state.CountPosValue(min)) * 2; 
ev += (state.CountMobility(max player id) - state.CountMobility(min)) * 7; 

else 

{ 
ev += (state.CountPosValue(max player id) - state.CountPosValue(min)) * 2; 
ev += (state.CountMobility(max player id) - state.CountMobility(min)) * 7; 
ev += (state.CountCell(max player id) - state.CountCell(min)) * 2; 

} 

return ev; 


} 


23.3.3 ”搜索 算法 实现 
23.2 节 介 绍 井 字 棋 游戏 时 提 到 的 极 大 极 小 值 搜索 算法 、 带 “oa-B” 剪 枝 


的 搜索 算法 和 负极 大 


值 搜索 算法 的 实现 ， 本 节 我 们 再 实现 一 种 搜索 算法 ， 就 是 23.1.4 市 介绍 的 带 “a-B” 剪 校 的 负极 


大 值 搜索 算 法 。 由 于 黑白 棋 游戏 搜索 过 程 中 状态 极 多 ,为 了 提高 搜索 效率 ， 
戏 的 搜索 算法 还 采用 了 启发 式 搜索 和 置换 表 技 术 。 再 次 重申 一 遍 ， 和 本 书 其 
例 一 样 ， 本 广 给 出 的 算法 都 使 用 了 最 简单 的 实现 形式 ， 目 的 是 为 了 让 大 家 更 
并 不 是 要 实现 一 个 棋 力 超 强 的 AI[。 有 时 候 为 了 算法 的 简洁 会 舍 充 一些 效率 


本 市 介绍 的 黑白 棋 游 
他 章节 给 出 的 算法 示 
E 解 算法 实现 的 原理 ， 
， 比 如 接 下 来 要 介绍 


的 置换 表 就 使 用 了 STL 库 的 map 容器 ， 更 高 效 的 做 法 可 以 参考 各 种 开源 软件 给 出 的 解决 方案 。 


1. 走 法 生成 

根据 黑白 棋 的 规则 , 任何 一 方 落 子 必需 要 能 翻转 对 方 的 棋子 , 这 就 是 黑 
规则 。 根据 这 个 规则 ,黑白 棋 的 走 法 生成 就 是 遍历 当前 的 空位 链表 ， 对 每 个 
是 否 能 在 8 个 方向 中 的 任 一 个 方向 翻转 对 方 的 棋子 : 


日 棋 走 法 生成 的 唯一 
空位 判断 如 果 落 子 后 


int GameState::FindMoves(int player id, int opp player id, std::vector<MOVES LIST>& moves ) 


{ 
std: :Vector<int> flips; 
MOVES LIST ml; 


moves.clear(); 
for(EMPTY_LIST *em = m EmHead.succ; em != NULL; em = em->succ) 


{ 


int cell = em->cell; 
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int flipped = DoFlips(cell, player id, opp player id, flips); 
if(flipped > 0) 
{ 


| board[cell] = player id; 

em->pred->succ=em->succ;//cell 链表 的 succ 链 暂 时 跳 过 em CountMobility 函数 会 用 到 这 个 链表 ) 
1.goodness = -CountMobility(opp player id); 

em->pred->succ = em; //cell 链表 的 succ 链 恢复 em 

l.em = em; 

UndoFlips(flips, opp_player id); 

| board[cell] = PLAYER NULL; 


oves .push back(ml); 
} 
j 


return moves.size(); 

} 

for 循环 遍历 空位 链表 ，Doflips() 函 数 尝试 翻转 对 手 的 棋子 (opp_player_id )， 如 果 返 回 值 
大 于 0， 则 说 明 此 处 落 子 能 翻转 对 方 的 棋子 ,被 翻转 的 棋子 位 置 被 记录 在 flips 数组 中 ， 因 为 在 
对 下 一 个 空位 进行 尝试 之 前 ， 要 调用 UndoFlips() 函 数 将 被 翻转 的 棋子 恢复 。FindMoves() 函 数 最 
后 将 合法 的 走 法 存 人 moves 数组 返回 ， 你 可 能 已 经 注意 到 了 ，moves 数组 除了 记录 可 落 子 的 空位 
链表 节点 之 外 ， 还 记录 了 一 个 goodness， 这 个 goodness 就 是 如 果 在 此 空位 落 子 能 获得 的 好 处 ， 
它 记录 的 是 落 子 后 对 手 的 行动 力 的 负数 ,说 明 如 果 对 手 的 行动 力 越 大 ， 这 个 落 子 获得 的 好 处 越 
低 。 记 录 这 个 值 的 目的 是 为 后 续 启 发 式 搜索 提供 启发 依据 ， 后 面 我 们 将 介绍 如 何 利 用 这 个 值 进 
行 启发 搜索 。 


2. 引入 置换 表 
黑白 棋 游 戏 搜索 过 程 中 会 出 现 很 多 中 间 覃 局 状态 ， 即 使 使 用 了 “o-B8” 剪 枝 ， 中 局 时 一 个 棋 
局 的 搜索 还 是 可 能 超过 20 万 个 棋局 状态 ( 搜索 深度 6 层 ), 这 中 间 显 然 有 很 多 棋局 状态 会 重复 出 


现 ， 为 此 我 们 为 搜索 算法 引入 了 置换 表 ， 和 希望 通过 置换 表 减 少 一 些 重 复 的 搜索 。 

置换 表 的 关键 是 查找 和 存储 , 高 效 的 哈 希 算法 是 置换 表 技 术 必 不 可 少 的 部 分 。 很 多 棋 类 游戏 
都 选择 Zobrist 哈 希 算法 ， 原 因 在 于 Zobrist 哈 希 算法 简单 ， 并 且 可 以 根据 棋盘 上 少数 位 置 的 变化 
小 范围 地 更 新 棋局 的 哈 希 值 , 不 必 因 为 改动 几 个 棋子 就 全 部 重新 计算 一 个 棋局 的 哈 希 值 , 非常 适 
合 棋 类 游戏 。 本 书 的 第 20 章 介 绍 华容 道 游戏 时 已 经 介绍 了 Zobrist 哈 希 算法 的 原理 和 实现 ， 本 章 
就 不 再 重复 说 明 。Zobrist 哈 希 算法 需要 为 每 个 棋盘 格子 的 状态 准备 一 个 随机 数 , 因此 需要 根据 棋 
类 游戏 中 每 个 棋盘 格子 的 状态 多 少 进行 调整 ， 大 家 可 以 通过 查看 othello 项 目 中 的 
InitZzobristHashTbl() 函 数 的 源 代 码 了 解 这 种 变化 。 

置换 表 的 更 新 策略 我 们 采用 深度 优先 策略 。 为 了 防止 置换 表 被 搜索 深度 很 深 的 棋局 占 满 , 无 
法 保证 棋局 评估 结果 的 实时 性 ， 我 们 选择 在 每 次 开始 搜索 前 重 置 一 下 置换 表 ， 即 在 
SearchBestPlay() 函 数 中 调用 ResetTranspositionTable() 消 数 。 借 助 于 STL 的 std: :map 容器 的 便利 
接口 ， 置 换 表 的 查找 和 更 新 算法 可 以 非常 简单 地 实现 : 
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bool LookupTranspositionTable(unsigned int hash，TT_ENTRY& ttEntry) 
{ 


std: :map<unsigned int, TT_ENTRY>::iterator it = tt map.find(hash); 
if(it != tt map.end()) 


ttEntry = it->second; 
return true; 


} 


return false; 


} 
void StoreTranspositionTable(unsigned int hash, TT_ENTRY& ttEntry) 
{ 


std: :map<unsigned int, TT_ENTRY>::iterator it = tt map.find(hash); 
if(it != tt map.end()) 
{ 
TT_ENTRY& old entry = it->second; 
if(ttEntry.depth >= old entry.depth) 
{ 
old entry = ttEntry; 


} 


else 
tt map[hash] = ttEntry; 


} 
3. 启发 式 搜索 


调用 FindMoves() 函 数 后 得 到 一 个 所 有 合法 走 法 的 列表 ， 在 后 续 的 博弈 树 搜 索 过 程 中 ， 如 果 
对 每 个 合法 的 走 法 不 假 思 索 、 机 械 地 搜索 , 最终 的 结果 就 是 盲目 搜索 。 如 果 能 利用 一 些 额 外 信息 
对 所 有 的 走 法 进行 适当 的 处 理 ， 减 少 一 些 无 谓 的 搜索 ， 即 可 称 为 启发 式 搜索 。 从 这 个 角度 理解 ， 
我 们 使 用 的 “oa-B” 剪 校 和 置换 表 技术 也 是 一 种 启发 式 搜 索 。 事 实 上 ， 棋 类 游戏 中 还 有 很 多 其 他 
的 启发 因素 ， 比 如 如 果 某 个 走 法 能 吃 掉 对 方 的 棋子 ， 则 优先 对 这 个 走 法 进行 搜索 ,把 不 能 吃 子 的 
走 法 放 在 后 面 搜索 。 如 果 有 多 个 能 吃 子 的 走 法 ,就 根据 吃 掉 的 对 方 棋子 的 棋 力 从 大 到 小 排序 ,这 
种 方法 可 以 笼统 地 称 为 走 法 排序 启发 。 

我 们 计划 在 黑白 棋 的 搜索 算法 中 应 用 一 下 走 法 排序 启发 。 根 据 什 么 排序 呢 ? 前 面 介 绍 
FindMoves() 函 数 时 统计 了 每 一 种 走 法 的 好 处 goodness， 实 际 上 就 是 对 手 行动 力 的 负 值 ， 我 们 就 根 
据 这 个 排序 。 因 为 我 们 的 估 值 函数 算法 考虑 了 行动 力 因素 ， 因 此 按照 对 自己 有 利 的 因素 排序 ， 首 
先 搜 索 对 自己 最 有 利 的 走 法 ， 可 以 使 得 搜索 算法 能 够 更 快 地 建立 准确 的 剪 枝 窗口 [xu, B]， 使 后 续 
的 剪 校 操作 更 高 效 。SortMoves() 函 数 负责 对 走 法 数组 排序 , 搜索 算法 每 次 调用 FindMoves() 函 数 得 
到 走 法 数组 后 ， 首 先 调用 SortMoves() 函 数 排序 ， 然 后 再 开始 具体 的 搜索 操作 。 

4. 搜索 算法 实现 

本 节 实 现 了 一 个 带 “orB” 剪 枝 的 负极 大 值 搜索 算法 NegamaxAlphaBetaSearcher， 同 时 引入 
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了 置换 表 技 术 。 完 整 的 搜索 算法 在 NegaMax() 函 数 中 : 


int NegamaxAlphaBetaSearcher: :NegaMax(GameState& state, int depth, int alpha, int beta, int 
max_player id) 
{ 


int alpha0rig = alpha; 


unsigned int state hash = state.GetZobristHash(); 


// 查 询 置换 表 
TT_ENTRY ttEntry = {0 }; 
if(LookupTranspositionTable(state hash, ttEntry) 8& (ttEntry.depth >= depth)) 
{ 
if(ttEntry.flag == TT_FLAG EXACT) 
return ttEntry.value; 
else if(ttEntry.flag == TT_FLAG LOWERBOUND) 
alpha = std::max(alpha, ttEntry.value); 
else// if(ttEntry.flag == TT_FLAG UPPERBOUND) 
beta = std::min(beta, ttEntry.value); 
if(beta <= alpha) 
return ttEntry.value; 
} 
if(state.IsGameOver() || (depth == 0)) 
{ 
return EvaluateNegaMax(state, max_player id); 
} 


int score = -INFINITY; 
int player id = state.GetCurrentPlayer(); 
int opp_ player id = GetPeerPlayer(player id); 


std::vector<MOVES LIST> moves; 

int mc = state.FindMoves(player id, opp_player id, moves); 
if(mc != 0) 

{ 


SortMoves (moves); 


std: :vector<int> flips; 
for(int i = 0; i < mc; i++) 
{ 
state.DoputChess(moves[i].em, player id, flips); 
state. Switchplayer(); 
int value = -NegaMax(state, depth - 1, -beta, -alpha, max_player id); 
state.UndoputChess(moves[i].em, player id, flips); 
state. Switchplayer(); 
score = std::max(score, value); 
alpha = std::max(alpha, value); 
if(beta <= alpha) 
break; 


else 
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{ 
state. Switchplayer(); 
score = -NegaMax(state, depth - 1, -beta, -alpha, max player id); 
state. Switchplayer(); 

. 

// 写 入 置换 表 


ttEntry.value = score; 
if(score “= alpha0rig) 
ttEntry.flag = TT_FLAG UPPERBOUND; 
else if(score >= beta 
ttEntry.flag = TT_FLAG LOWERBOUND; 


Pep 


LS 


ttEntTy.flag = TT_FLAG EXACT; 


ttEntry.depth = depth; 
StoreTranspositionTable(state hash, ttEntry); 


return score; 


} 

在 棋局 搜索 之 前 , 首先 调用 LookupTranspositionTable() 函 数 查 找 置换 表 ,， 如 果 置 换 表 中 存在 
搜索 深度 大 于 或 等 于 当前 搜索 深度 的 结果 ， 就 直接 使 用 这 个 结果 。 根 据 flag 标志 的 值 ， 可 以 分 
三 种 情况 使 用 这 个 置换 表 条 目 : 如 果 flag 的 值 是 TT_FLAG_EXACT,， 则 value 的 值 就 是 最 终 佑 值 ， 如 
果 flag 的 值 是 TT_FLAG_UPPERBOUND 或 TT_FLAG LOWERBOUND, 则 vlaue 的 是 目前 对 这 个 棋局 搜索 过 程 
中 已 知 的 极 大 a 和 极 小 了 B 值 ， 在 其 后 的 搜索 过 程 中 可 以 据 此 更 新 当前 的 前 枝 窗 口 [a, PB]。 


NegaMax() 孙 数 的 最 后 阶段 是 将 搜索 结果 存 人 置换 表 。 存 和 人 置换 表 之 前 首先 要 根据 当前 搜索 的 
结果 更 新 剪 枝 窗口 [a, 站 的 范围 ， 如 果 当 前 搜索 的 估 值 不 在 这 个 范围 ， 则 说 明 这 个 佑 值 是 个 精确 
值 , 需要 设置 flag 标志 的 值 为 TT_FLAG_EXACT。 如 果 当 前 佑 值 小 于 a, 则 说 明 当 前 估 值 可 作为 后 续 
搜索 的 极 大 剪 校 (a 剪 枝 ) 边界 值 。 如 果 当 前 估 值 大 于 B， 则 说 明 当 前 佑 值 可 作为 后 续 搜 索 的 极 
小 剪 校 (B 剪 校 ) 边界 值 。 


23.3.4 “最终 结果 


至 此 ， 与 黑白 棋 游 戏 相 关 的 棋盘 模型 、 佑 值 函 数 、 搜 索 算 法 都 介绍 完了 ， 将 以 上 算法 实现 
放 人 我 们 的 棋 类 游戏 代码 框架 ,就 可 以 得 到 一 个 控制 台 界 面 的 黑白 棋 对 战 程 序 。 我 们 的 AI 算法 
棋 力 虽然 不 高 ， 但 是 我 仍然 不 能 战胜 它 ， 搜 索 深 度 是 6 层 的 情况 下 ， 我 被 电脑 杀 得 一 败 涂 地 。 
我 用 一 个 搜索 深度 是 4 层 的 电脑 和 一 个 搜索 深度 是 3 层 的 电脑 对 战 ， 发 现 搜索 深度 是 4 层 的 电 
脑 几乎 100% 地 获胜 ， 看 来 基于 博弈 树 搜 索 的 AI 算法 ， 能 多 搜索 一 层 就 能 占 很 大 的 优势 。 网 上 
公开 的 几 个 棋 力 比较 强 的 几 个 AI 算法， 在 终局 阶段 都 能 达到 18 ~ 22 层 的 搜索 深度 ， 几 乎 能 搜 
到 最 终 状 态 了 。 


23.4 五 子 棋 二 385 


23.4 五子棋 


五 子 棋 流 行 非常 广泛 ， 在 不 同 的 国家 有 不 同 的 名 称 ， 英 文 名 称 为 FIR( Five In a Row )。 标准 
的 五 子 棋 棋 盘 是 15 x 15 大 小 ， 用 数字 1 ~ 15 标识 棋盘 的 行 ， 用 字母 A ~ O 标识 棋盘 的 列 ， 棋 子 
和 围棋 一 样 有 黑白 两 种 颜色 ， 可 以 和 围棋 的 棋局 通用 。 下 棋 的 双方 轮流 在 15 x 15 条 线 的 交叉 点 
上 落 子 ， 先 在 横 、 竖 和 和 斜 线 方向 上 形成 五 子 连 线 的 一 方 获胜 。 

作为 一 种 策略 类 的 游戏 , 五 子 棋 也 有 很 多 “型 ”, 按照 五 子 棋 的 术语 称 为 “ 冲 四 ”“ 活 三 ”等 。 
首先 来 介绍 一 下 “ 冲 ”， 棋 型 的 两 端 有 界 的 档 称 为 “ 冲 ”， 根 据 相连 棋子 个 数 可 有 “ 冲 二 ”“ 冲 三 ” 
“ 冲 四 ”等 说 法 。 图 23-7 就 是 黑 棋 “ 冲 四 ”的 两 种 棋 型 ， 与 黑 棋 的 一 端 直接 接触 的 要 么 是 白 棋 ， 
要 么 是 边界 ， 如 果 黑 棋 的 两 端 都 是 空位 ， 则 这 个 棋 型 就 成 了 “ 活 四 ”。 “ 活 ” 的 定义 是 棋 型 的 两 端 
都 是 无 界 约束 ( 两 端 不 和 对 手 的 棋子 或 边界 直接 接触 )， 但 是 根据 相连 棋子 的 个 数 ， 对 两 端的 空 
位 的 数量 也 有 要 求 。 以 图 23-8a 所 示 的 “ 活 三 ”为 例 ， 除 了 要 求 两 端 为 空位 外 ， 还 要 求 其 中 一 端 
至 少 有 两 个 空位 ， 即 要 求 空 位 数 至 少 有 三 个 。 图 23-8b 所 示 的 “ 跳 活 三 ”是 另 一 种 情况 ， 加 上 中 


间 空 位 也 是 至 少 J 受 个 空 人 Le 


图 23-7 “ 冲 四 ” 棋 型 示意 图 


ee 


(a) (b) 


图 23-8 “ 活 三 ” 棋 型 示意 图 


大 多 数 的 棋 类 游戏 先 手 落 子 一 方 都 会 不 同 程度 地 占有 一 些 优势 , 五子棋 也 不 例外 ,不 仅 如 此 ， 
现代 计算 机 的 大 量 模拟 计算 证 明 , 五 子 棋 存 在 一 些 特定 的 走 法 , 按照 步 又 走 这 些 走 法 可 以 保证 能 
战胜 对 手 。 为 此 ， 人 们 设置 了 很 多 五 子 棋 特 有 的 比赛 规则 ,“ 禁 手 ” 就 是 其 中 一 种 最 常用 的 方法 。 


所 谓 “ 禁 手 ”， 就 是 禁止 先 手 一 方 (通常 是 黑 棋 ) 走 某 些 特定 的 棋 型 ， 这 些 棋 型 要 么 会 使 得 先 手 

方 占 有 某 种 不 平等 优势 ， 要 么 会 使 得 先 手 一 方 必 胜 。“ 禁 手 ” 棋 型 有 很 多 ， 比 如 常见 的 “四 四 
禁 手 ”“ 三 三 禁 手 ”“ 长 连 禁 手 ” 等 。 图 23-9a 是 “四 四 禁 手 ” 的 两 种 常见 棋 型 ， 图 23-9b 是 “三 
三 禁 手 ”的 两 种 常见 棋 型 。 一 般 来 说 ， 比 赛 中 黑 棋 只 要 走 了 “ 禁 手 ”， 白 棋 可 立即 指出 ， 此 时 判 
黑 棋 负 。 如 果 白 棋 没 有 指出 ， 则 比赛 继续 进行 。 在 某 些 情况 下 ， 如 果 规 则 人 允许， 白 棋 甚至 可 以 通 
迫 或 诱骗 黑 棋 走 出 “ 禁 手 ”， 从 而 赢得 比赛 。 当 然 ， 黑 棋 如 果 看 出 白 棋 的 阴谋 ， 但 是 又 无 其 他 路 


可 走 ， 还 可 以 选择 放弃 一 手 ， 也 就 是 让 白 棋 再 走 一 步 ， 无 论 如 何 ， 这 对 黑 棋 都 非常 不 利 。 
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图 23-9 “ 禁 手 ” 棋 型 示意 图 


根据 以 上 对 五 子 棋 游戏 规则 的 分 析 ， 可 知 一 个 五 子 棋 游 戏 的 AI 算法 除了 搜索 算法 、 估 值 算 
法 等 内 容 之 外 ， 还 要 能 识别 出 特殊 的 棋 型 ， 比 如 各 种 “ 冲 ” 或 “ 活 ” 的 棋 型 ， 这些 都 是 估 值 函数 
评估 的 依据 。 除 此 之 外 , 还 要 能 识别 出 各 种 “ 禁 手 ” 棋 型 , 并 且 在 走 法 生成 的 时 候 直接 过 滤 掉 “ 禁 
手 ”。 接 下 来 我 们 将 介绍 五 子 棋 游 戏 的 数据 模型 ， 这 个 模型 的 好 坏 将 直接 影响 到 棋 型 判断 算法 的 


实现 复杂 度 。 


23.4.1 棋盘 与 棋子 的 数学 模型 


23.3.1 节 介 绍 黑白 棋 游 戏 的 棋盘 数据 模型 时 ， 介 绍 了 Warren Smith 在 其 黑白 棋 终 局 处 理 算 法 
中 使 用 的 一 种 棋盘 状态 模型 ( 如 下 所 示 ), 我 们 的 黑白 棋 AI 算法 也 使 用 了 这 个 模型 ， 现 在 我 们 的 
五 子 棋 游 戏 也 继续 使 用 这 个 模型 。 


dddddddddd 
dXXXXXXXXX 
dXXXXXXXXX 
dXXXXXXXXX 
dXXXXXXXXX 
dXXXXXXXXX 
dXXXXXXXXX 
dXXXXXXXXX 
dXXXXXXXXX 
dXXXXXXXXX 
ddddddddddd 


关于 直接 使 用 二 维 数 组 和 使 用 一 维 数组 的 优 缺 点 在 23.3.1 节 已 经 介绍 过 了 ， 这 里 不 再 获 述 。 
五 子 棋 游 戏 的 棋盘 和 黑白 棋 游 戏 的 棋盘 有 很 大 的 差异 ， 需 要 对 Warren Smith 的 模型 做 适当 的 修 
改 。 标 准 的 五 子 棋 游 戏 是 15 x 15 的 棋盘 ， 但 是 我 们 演示 AI 算法 的 程序 使 用 9 x 9 的 小 棋盘 ， 一 
方面 是 为 了 便于 展示 算法 的 实现 效果 , 另 一 方面 是 加 快 计算 机 “ 想 棋 ”的 速度 , 毕竟 棋盘 减 小 了 ， 
需要 的 计算 量 会 呈 几 何 级 数 减 少 。9 x 9 的 小 棋盘 用 Warren Smith 模型 表示 ， 需 要 一 个 长 度 为 111 


‘Oo OU 
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的 一 维 数组 表示 黑白 棋 的 棋盘 与 棋子 状态 , 其 中 81 个 是 棋盘 上 的 位 置 , 30 个 是 标志 位 或 哨兵 位 。 
111 个 数组 元 素 中 前 11 个 和 后 11 个 是 标志 位 , 中 间 每 间隔 9 个 x 位 置 插入 一 个 标志 位 d, 这 个 模 
型 各 个 位 置 的 逻辑 结构 如 上 一 页 的 阵列 所 示 。 

棋盘 大 小 调整 了 , 方向 数组 的 步 进 量 也 需要 调整 。 五子棋 的 搜索 方向 比较 简单 ， 只 关注 棋子 
在 横 、 竖 和 两 条 斜 交 义 线 上 是 否 有 连续 出 现 的 情况 , 只 需 治 四 个 方向 搜索 即 可 。 根据 Warren Smith 
模型 的 关系 ， 适 用 于 9 x9 棋 盘 的 方向 数组 调整 如 下 : 

const int dir inc[] = {1, 9, 11, 10}; 

模型 中 的 元 素 与 实际 棋盘 上 的 行 和 列 的 坐标 换算 关系 也 调整 为 : 

square(row, col) = board[11+col+rowx10] (0<= row, Col <=8) 

至 此 ， 整 个 五 子 棋 的 数据 模型 就 建立 了 。 

应 用 这 个 一 维 棋盘 模型 , 可 以 极 大 地 方便 后 续 算 法 的 设计 , 现在 就 以 判断 是 否 有 棋 手 完成 五 
子 连珠 的 算法 为 例 ， 演 示 一 下 这 个 模型 给 我 们 的 算法 实现 带 来 的 便利 。 下 棋 的 双方 每 落下 一 子 ， 
游戏 控制 器 就 要 检查 棋盘 状态 上 是 否 构成 了 五 子 连珠 ， 如 果 有 五 子 连 珠 ， 则 设置 游戏 结束 标志 ， 


并 给 出 有 


竹 利 者 的 ID 以 便 最 后 输出 胜 负 结 果 。 这 个 检查 算法 的 原理 很 简单 ， 就 是 从 落 子 位 置 开 始 ， 


在 一 条 线 上 沿 正 向 和 反 向 分 别 搜索 与 落 子 棋子 相同 的 棋子 个 数 , 如 果 从 正 、 反 两 个 方向 搜索 到 的 
相同 棋子 个 数 之 和 大 于 或 等 于 5， 则 判定 有 棋 手 完成 了 五 子 连珠 。 


bool GameState::CheckLinefive(int cell, int dir inc, int player id) 


{ 


} 


int count = 1; 
int ct = cell - dir inc; 
while(m board[ct] == player id) 
{ 

Count++; 

ct -= dir inc; 


) 


ct = cell + dir inc; 
while(m board[ct] == player id) 
{ 

Count++; 

ct += dir inc; 


} 


return (count >= 5); 


CheckLinefive() 函 数 每 次 搜索 一 条 线 ， 步 进 增 量 dir_inc 取 负 表示 沿 者 这 条 线 的 向 反方 向 搜 
索 。 对 四 条 线 都 搜索 一 次 就 可 以 判断 在 四 个 方向 上 是 否 有 五 子 连珠 ， 这 正 是 CheckFiveInRow() 函 
数 所 做 的 事情 。 


boo 


{ 


1] GameState: :CheckFiveInRow(int cell, int player id) 


for(int i = 0; i < DIR COUNT; i++) 
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if(CheckLinefive(cell, dir inc[i], player id)) 
{ 


return true; 
} 
} 


return false; 


23.4.2“” 估 值 函数 与 估 值 算法 


五 子 棋 游 戏 的 局 面 评 估 主 要 是 根据 棋 型 来 评估 ， 比 如 已 方 棋子 达成 五 子 连 珠 ,， 表示 这 是 一 个 
胜局 ,应 该 给 出 最 高 分 ， 如 果 是 对 手 的 棋子 达成 五 子 连 珠 ， 表 示 这 是 最 糟糕 的 局 面 ， 就 应 该 给 出 
最 低 分 。 如 果 有 “ 活 四 ”出 现 ， 就 意味 着 离 胜利 只 有 一 步 之 遥 ， 也 应 该 给 予 适 当 的 评估 分 。 由 此 
可 见 ， 正 确 地 识别 出 五 子 棋 的 各 种 棋 型 是 五 子 棋 估 值 算法 实现 的 关键 。 

1. 棋 型 计算 

五 子 棋 的 棋盘 上 , 单个 的 棋子 对 对 手 基 本 上 没有 太 大 的 威胁 , 两 个 以 上 的 连 子 才 开始 对 对 手 
构成 威胁 ， 因 此 棋 型 的 识别 应 该 从 “ 活 二 ”和 “ 冲 二 ”开始 。“ 冲 三 ”和 “ 活 三 ”的 威胁 就 又 进 
了 一 步 ， 特 别 是 “ 活 三 ”， 如 果 对 手 此 时 不 及 时 处 置 ， 再 过 一 手 就 发 展 成 “ 活 四 ”， 这 是 必 胜 的 棋 
型 之 一 。 

五 子 棋 的 棋 型 识别 是 基于 横 线 、 竖 线 和 正 反 两 条 斜 线 共 四 个 方向 , 横 线 和 竖 线 比较 规整 ,但 
是 正 反 两 条 斜 线 比较 难处 理 ， 这 正 是 我 们 放弃 二 维 棋盘 模型 的 原因 。 根 据 我 们 的 数据 模型 定义 ， 
我 们 将 线 定义 为 一 个 起 点 和 一 个 方向 步 进 量 组 成 的 二 元 组 , 起 点 是 棋盘 上 的 点 对 应 的 数据 模型 中 


的 位 置 (一 维 数组 的 下 标 )， 从 起 点 开始 ， 通 过 三 加 步 进 量 移动 到 下 一 个 点 ， 逐 次 县 加 步 进 量 直 
到 遇 到 哨兵 位 ， 这 期 间 的 点 就 是 这 条 线 上 的 点 。 图 23-10 是 棋盘 上 的 线 与 数据 模型 的 位 置 关系 示 


意图 ， 图 中 每 个 圆圈 代表 9 x 9 棋盘 上 的 一 个 人 位置， 圆圈 中 的 数字 是 这 个 棋盘 位 置 在 数据 模型 中 
的 位 置 。 从 图 中 可 以 看 到 ， 九 条 横 线 的 起 点 分 别 是 11、21、31、41、51、61、71、81、91 这 九 
个 点 ， 其 方向 步 进 量 是 1。 九 条 竖 线 的 起 点 分 别 是 11、12、13、14、15、16、17、18、19 这 九 个 
点 ， 其 方向 步 进 量 是 10。 和 斜 线 需要 注意 一 下 ， 四 个 角 上 的 斜 线 如 果 棋 子 总 数 小 于 5 是 可 以 排除 
掉 的 ， 因 为 这 些 线 上 肯定 构 不 成 五 子 连 珠 。 正 斜 线 方向 的 起 点 是 11、12、13、14、15$、21、31、 
41、51 这 九 个 点 ， 其 方向 步 进 量 是 11。 同 样 ， 反 和 斜 线 方向 的 起 点 是 13、16、17、18、19、29、 
39、49、59 这 九 个 点 ， 其 方向 步 进 量 是 9。 


按照 这 个 思路 ， 我 们 先 给 出 线 的 定义 : 


typedef struct tagLines 


int line s[MAX LINE S]; 
int off dir; 
}LINES; 
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然后 根据 图 23-10 准备 好 四 个 方向 上 所 有 线 的 起 点 列表 和 方向 步 进 量 : 


LINES line cpts[4] = {...} 


OOOOEOO0O 
33)(34)(35 36)(3N(38 
2 CS) 


59G5)G9 OE 
065)G69 5 
71 72 73 Ce 220C9) 
81 ,i 82 ee 85 (86 Dles) 

7)(98) 99 


图 23-10 棋盘 线 与 数据 模型 位 置 关 系 示意 图 


SearchpPatterns() 函 数 的 外 层 for 循环 完成 对 四 个 方向 的 遍历 ， 内 层 for 循环 完成 对 每 个 方向 
9 条 线 的 遍历 ，ev_ata 参数 返回 棋 型 识别 的 结果 。 所 有 的 线 都 可 以 用 AnalysisLine() 函 数 进行 
一 致 化 处 理 ， 这 就 是 我 们 的 数据 模型 的 优点 。 


void GameState: :Searchpatterns(EvaluatorData &ev ata) 


Xe 


om 
om 
vw 


ww 
ww 
N 
WwW 
EE 
A 
a 
vw 


{ 
for(int i = 0; i < COUNT OF(line cpts); i++)// 每 个 方向 
{ 
for(int j = 0; j < MAX_LINE _S; j++)// 每 个 方向 条 线 
{ 
AnalysisLine(line cpts[i].line s[j], 
line cpts[i].off dir, ev ata); 
} 
} 
} 


AnalysisLine() 消 数 不 关 心 是 横 线 还 是 竖 线 , 它 只 根据 线 的 起 点 和 方向 步 进 量 进行 扫描 , 可 以 
一 次 性 将 一 条 线 上 黑白 棋 的 棋 型 都 识别 出 来 。 棋 型 识别 的 关键 是 先 找 出 连续 棋子 的 开始 位 置 和 结 
束 位 置 ， 然 后 在 这 基础 上 向 前 和 向 后 寻找 空位 ， 如 果 连 子 数 和 空位 数 小 于 5， 则 说 明 这 些 连 子 最 
后 不 可 能 形成 五 子 连珠 ,不 会 构成 威胁 , 统计 时 可 忽略 这 些 连 子 ,避免 影响 估 值 算法 的 结果 。 只 
有 连 子 数 和 空位 数 大 于 5 的 时 候 ， 连 子 才 可 能 对 对 手 构 成 威胁 ， 此 时 需要 进一步 判断 是 “ 冲 ” 还 
是 “ 活 ”。 如 果 连 子 的 两 端 都 有 空位 ， 且 任意 一 端的 空位 数 大 于 或 等 于 (5 - 连 子 数 -1)， 则 直接 
判定 为 “ 活 ”。 如 果 et 则 判定 为 “ 冲 ”， 如 果 连 子 两 端 是 
空位 ,但 是 不 满足 “ 活 ” 条 件 的 也 判定 为 “ 冲 ”。 以 上 就 是 识别 算法 的 简单 描述 ， 具 体 实现 请 看 
en 
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void Gamestate::AnalysisLine(int st, int dir inc, EvaluatorData &ev ata) 


{ 


int mark cell,mark player id; 


int et = st; 
while(m board[ct] != DUMMY) 
{ 


ct = SkipEmptyCell(ct，dir inc);// 向 后 跳 过 空位 
if(m board[ct] == DUMMY) // 已 经 到 哨兵 位 ? 直接 结束 
break; 


mark cell = ct; 

mark_player id = m board[ct]; 

int count = 0; 

ct = SearchAndCountChess(ct, dir inc, mark player id, count); 
if(count >= 5) 


{ 

ev_ata.IncreaseCounter(5, mark player id, false); 
} 
else if(count >= 2) 


int pre Space = 0; 

int succ _ space = 0; 

// 向 前 寻找 空位 

int tmp t = mark cell - dir inc; 

tmp t = SearchAndCountChess(tmp t, -dir inc, PLAYER NULL, pre space); 
// 向 后 寻找 空位 

ct = SearchAndCountChess(ct, dir inc, PLAYER NULL, succ space); 

if((m board[ct] == mark player id) && (succ space == 1)) 


// 处 理 “ 跳 ”的 情况 

count++; // 多 了 一 个 棋子 

int space need = 5 - count; 

bool succ close = (m board[ct + dir inc] != PLAYER NULL); 
if((pre space + succ space) >= space need) 


ev_ata.IncreaseCounter(count, mark player id, succ close); 


else 


// 除 了 count 个 连 子 之 外 ， 还 需要 5-count 个 空位 ， 才 能 构成 冲 X 或 活 X 
int space need = 5 - count; 

// 两 端 都 有 空位 ， 且 任意 一 端的 空位 数 大 于 等 于 space need， 直 接 定 为 活 X 
if( ((pre _ space > 0) && (succ _ space > 0)) 


&& ((pre space >= space need) || (succ space >= space need)) ) 
{ 
ev_ata.IncreaseCounter(count, mark player id, false); 
} 
else 
{ 


// 两 端 是 否 有 封闭 

bool pre close = (m board[mark cell - dir inc] != PLAYER NULL); 
bool succ close = (m board[ct] != PLAYER NULL); 

// 空 位 足够 连 成 5 子 才 统计 
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if((pre space + succ space) >= space need) 
ev ata.IncreaseCounter(count, mark player id, pre close||succ close); 


} 
} 
} 
} 
} 


SearchAndCountChess() 函 数 从 cs 参数 指定 的 开始 位 置 搜索 指定 id 的 棋子 的 个 数 ( 通过 count 
参数 返回 )， 返 回 搜 索 结 束 时 的 位 置 。 尽 管 通过 SearchAndCountChess() 函 数 减 少 了 几 十 行 代码 ， 
但 是 AnalysisLine() 函 数 仍然 是 本 书 迄 今 为 止 最 长 的 函数 ， 不 过 我 相信 你 一 定 见 过 比 这 更 长 的 棋 
型 识别 算法 。 

2. 估 值 算法 

对 棋局 进行 估 值 ,除了 识别 出 槛 型 ， 还 要 给 不 同 的 棋 型 指定 评估 分 数 ， 以 便 估 值 函数 进行 计 
算 。 本 书 给 出 了 一 种 简单 的 模型 记分 规则 : 

五 子 连珠 计 10000 分 
口 “ 活 四 ”“ 双 冲 四 ”“ 冲 四 活 三 ”这 三 种 情况 分 别 计 9900 分 


口 


口 “ 双 活 三 ”“ 双 冲 四 ”这 两 种 情况 分 别 计 9800 分 

口 “ 活 三 冲 三 ”“ 冲 四 活 三 ”这 两 种 情况 分 别 计 9700 分 
口 “ 冲 三 ”一 次 计 300 分 

口 “ 活 二 ”一 次 计 200 分 

口 “ 冲 二 ”一 次 计 50 分 


除 此 之 外 , 我 们 的 估 值 算法 还 考虑 位 置 分 。 对 于 五 子 棋 游 戏 来 说 , 边 是 比较 差 的 位 置 ， 靠 近 
边 的 一 侧 发 展 受 限 ,除非 迫不得已 或 廊 让 对 手 , 一 般 情况 下 棋 手 都 不 会 先 靠 边 上 落 子 。 但 是 计算 
机 傻 ， 特 别 是 在 开局 阶段 ， 棋 盘 上 的 子 很 少 ， 棋 型 的 估 值 贡献 为 0， 此 时 计算 机 就 会 随机 落 子 ， 
有 可 能 就 落 在 边 上 ,为 了 告诉 计算 机 在 这 种 情况 下 如 何 处 理 , 我 们 给 棋盘 的 每 个 点 设置 了 位 置 分 。 
边界 上 的 点 位 置 分 是 0， 越 靠 中 间 位 置 分 越 高 ， 告 诉 电 脑 如 果 不 知道 怎么 落 子 的 时 候 ， 就 往 中 间 
位 置 放 。 

评估 分 超过 9000 的 都 是 必 胜 的 棋局 ， 这 种 情况 下 就 根据 棋 手 的 情况 直接 返回 分 数 ， 其 他 情 
况 下 统计 包括 位 置 分 在 内 的 棋 型 得 分 。 在 前 面 介绍 的 棋 型 计算 的 基础 上 , 评估 算法 的 实现 就 非常 
简单 了 ， 此 处 就 不 再 列 出 代码 。 


23.4.3 ”搜索 算法 实现 


搜索 算法 我 们 依然 采用 带 “oa-B” 剪 校 的 负极 大 值 搜索 算法 ， 这 个 算法 在 23.3 节 介 绍 黑白 棋 
的 时 候 已 经 介绍 过 。 本 将 介绍 与 五 子 棋 有 关 的 走 法 生成 和 “ 禁 手 ”判断 。 
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1. 走 法 生成 

除了 “ 禁 手 ”之 外 ， 五子棋 的 落 子 没有 特殊 的 规则 ,棋盘 上 任意 空位 都 可 以 落 子 。 因 此 走 法 
生成 算法 就 是 遍历 棋盘 上 的 所 有 空位 ， 排 除 掉 “ 禁 手 ” 位 置 ， 剩 下 的 就 是 可 走 的 位 置 。 当 然 ， 我 
们 也 可 以 根据 位 置 分 对 所 有 可 落 子 的 位 置 进行 排序 , 作为 走 法 排序 启发 搜索 的 依据 。 走 法 生成 由 
FindMoves() 函 数 实现 ， 因 为 算法 简单 ， 这 里 也 不 列 出 代码 了 。 

2. “ 禁 手 ”判断 

“ 禁 手 ”是 一 种 特殊 的 模型 ， 如 果 将 “ 禁 手 ” 理 解 为 在 一 个 可 以 落 子 的 位 置 周 围 几 个 特定 位 
置 上 不 能 同时 有 己方 棋子 ， 那 么 对 “ 禁 手 ” 建 模 就 非常 简单 了 。 以 图 23-9 的 “ 禁 手 ”示意 图 为 
例 ， 如 果 黑 棋 想 在 x 位 置 落 子 , 需要 判断 在 几 个 黑 棋 位 置 是 否 都 有 黑 棋 ， 这 些 位置 与 x 位 置 存 在 
某 种 关系 ,根据 我 们 的 棋盘 数据 模型 ， 这 种 关系 就 是 方向 步 进 偏 移 。 以 图 23-9a 左 侧 的 “四 四 禁 


手 ” 示 意图 为 例 ,， x 位 置 左 侧 的 三 个 黑 棋 位 置 与 x 的 方向 步 进 偏 移 分 别 是 -1 、-2 和 -3, x 位 置 下 
方 的 三 个 黑 棋 位 置 与 x 的 方向 步 进 偏 移 分 别 是 10、20 和 30。 


根据 以 上 分 析 ， 我 们 将 “ 禁 手 ”的 数据 模型 定义 为 : 
typedef struct tagForbiddenItem 
int off_inc[MAX_FORBIDDEN_PATTERN] ; 


int off _ cnt; 
}FORBIDDEN_ITEM; 


off_cnt 记录 这 个 “ 禁 手 ” 棋 型 中 相关 的 棋子 个 数 ，off_inc 数组 记录 这 些 棋子 相对 当前 位 置 
的 方向 步 进 偏 移 。 利 用 这 个 数据 模型 ， 预 先 将 各 种 “ 禁 手 ”组 织 成 一 个 列表 : 
FORBIDDEN ITEM forbidden patterns[|] = 
{ 
{ -1,-2,-3,10,20,30 入 


6 
]， 


天 
“ 禁 手 ” 判 断 的 算法 就 是 遍历 这 个 “ 禁 手 ” 表 ， 对 每 个 “ 禁 手 ”模型 判断 相关 位 置 上 的 已 方 
棋子 是 否 与 “ 禁 手 ”模型 匹配 ， 如 果 匹 配 则 说 明 当 期 落 子 位 置 是 一 个 “ 禁 手 ”。 对 单个 “ 禁 手 ” 
模型 匹配 的 算法 实现 如 下 : 


bool GameSstate::IsMatchSingleForbidden(FORBIDDEN_ITEM& item, int cell, int player id) 
{ 


int match cnt = 0; 

for(int j = 0; j < item.off cnt; j++) 

{ 
int cf = cell + item.off inc[j]; 
if((cf >= 0) 8& (cf < BOARD CELLS)) 


{ 
match cnt += ((m board[cf] == player id) ? 1 : 0); 
} 
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} 
return (match cnt == item.off cnt); 
} 
match_cnt 记录 匹配 的 棋子 个 数 ， 如 果 match_cnt 与 这 个 模型 中 的 棋子 个 数 相 等 ， 则 说 明 符 合 


该 “ 禁 手 ”模型 ， 是 一 个 禁 手 。 


23.4.4 “最终 结果 


将 以 上 算法 实现 放 入 我 们 的 棋 类 游戏 代码 框架 , 就 可 以 得 到 一 个 控制 台 界 面 的 五 子 棋 对 战 程 
序 。 这 个 AI 还 是 比较 弱智 的 ,看 来 还 有 很 大 的 改进 余地 。 如 果 要 实现 一 个 15 x 15 标准 棋盘 的 五 
子 棋 游 戏 ， 只 需 修 改 几 个 常量 定义 和 GameState 类 的 几 个 数据 结构 即 可 ， 整 个 算法 都 是 通用 的 。 
只 是 换 成 标准 棋盘 后 计算 量 太 大 , 搜索 深度 为 3 的 时 候 计 算 机 每 一 次 要 想 很 长 时 间 , 你 要 有 心理 
准备 。 


23.5 总结 


博弈 树 的 搜索 是 当前 棋 类 游戏 的 AI 基础 算法 ， 当 某 一 天 计算 机 的 处 理 能 力 强 到 可 以 搜索 出 
所 有 棋局 状态 的 时 候 , 计算 机 之 间 的 对 战 就 真 的 是 一 点 意思 都 没有 了 , 有 的 棋 是 先行 者 总 是 胜利 ， 
有 的 棋 则 无 论 如 何 都 是 平局 。 博 弈 树 的 搜索 不 仅仅 用 于 棋 类 游戏 , 它 是 人 工 智能 领域 一 个 重要 的 
研究 方向 , 许多 完全 信息 的 二 人 零 和 博弈 问题 都 可 以 用 博弈 树 搜索 算法 解决 。 在 博弈 树 搜 索 算法 
方面 ， 前 人 做 了 许多 丰富 而 充满 意义 的 研究 工作 ， 这 些 都 是 我 们 研究 这 些 算 法 乐趣 的 来 源 。 

本 章 介 绍 了 几 种 最 基本 的 博弈 树 搜索 算法 和 三 种 简单 的 棋 类 游戏 实现 , 我 并 不 是 这 些 棋 类 游 
戏 的 高 手 ， 所 以 不 要 指望 我 “调教 ”出 来 的 算法 有 太 高 的 “智商 "”。 但 是 本 章 实现 的 算法 都 是 实 
现 一 个 自动 下 棋 的 AI 的 基本 内 容 ,， 可 以 作为 继续 提高 “智商 ”的 起 点 。 改 进 可 从 几 个 方面 进行 ， 
首先 是 数据 模型 的 改进 ， 可 以 使 用 数据 量 更 小 的 “位 棋盘 ”( bitboard )， 将 棋盘 状态 的 数据 减少 
到 128 比特 以 内 ， 就 可 以 充分 利用 现代 CPU 的 高 阶 寄 存 器 提高 计算 和 数据 处 理 的 速度 。 其 次 是 
搜索 算法 的 改进 ， 比 如 应 用 剪 枝 效率 更 高 的 PVS 或 MTD(G) 算 法 ， 启 用 开局 库 和 更 高 效 的 启发 搜 
索 等 。 最 后 是 估 值 函数 的 设计 ， 本 章 给 出 的 都 是 最 基本 的 估 值 函数 ， 某 些 系数 都 不 是 最 优 的 ， 所 
以 棋 力 不 强 ， 有 很 大 的 改进 余地 。 改 进 估 值 函数 的 算法 ， 是 提高 棋 力 最 直接 的 方法 。 

最 后 青 喝 唆 一 下 ,看 似 复杂 和 神秘 的 东西 ， 只 要 有 简单 的 理论 指导 ,其 实现 一 定 也 简单 。 棋 
类 游戏 的 AI 算法 再 次 印证 了 这 一 点 ， 以 后 对 电脑 下 棋 应 该 不 会 再 感到 神奇 了 ， 基 本 的 东西 就 是 
这 些 ， 关 键 就 是 细节 的 处 理 ， 谁 的 细节 处 理 得 强大 ， 谁 的 棋 力 就 强大 。 
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附录 A 
算法 设计 的 钊 用 近 苞 


实现 一 个 算法 的 目的 是 解决 一 个 实际 的 问题 , 编写 一 个 解决 问题 的 算法 涉及 数据 结构 、 问 题 
域内 相关 的 理论 知识 、 对 程序 构造 的 理解 等 方面 的 知识 。 当 然 , 具体 到 算法 实现 阶段 ,也 有 很 多 
实用 的 小 技巧 可 以 起 到 锦上添花 的 作用 。 本 书 整理 了 一 些 编写 算法 实现 常用 的 技巧 , 希望 这 些 技 


巧 在 你 写 程序 的 时 候 能 派 上 用 场 。 


A.1 数组 下 标 处 理 
数组 的 下 标 是 一 个 隐 含 的 很 有 用 的 属 必 


E, 巧妙 地 使 用 这 个 属性 , 对 简化 算法 实现 有 很 大 的 帮 


助 。 本 书 2.2.1 节 介 绍 的 统计 数组 中 重复 元 素 个 数 的 例子 就 使 用 了 这 个 技巧 ， 只 用 两 行 代码 就 实 


现 了 这 个 算法 。 在 4.4.2 节 介绍 阿拉 伯 数 字 


转 中 文 数字 的 例子 中 再 次 使 用 了 这 个 技巧 ， 结 合 一 个 


预先 准备 好 的 中 文 数字 与 阿拉 伯 数 字 对 照 表 : 


const char *chnNumChar[CHN_NUM CHAR COUNT] = {“ 零 ”， “一 ”， “二 ”， “三”， “四 ”， “五 ”，“ 六 ”,， “七”，“ 八 ”， 


九 ”}】); 


字 就 是 : 
chnNumChar[5] 


利用 数组 下 标 只 需 一 行 代码 就 可 找到 阿拉 伯 数 字 对 应 的 中 文 数字 , 比如 数字 5 对 应 的 中 文 数 


在 某 些 情况 下 ， 问 题 域内 的 一 些 特殊 数据 元 素 ， 比 如 ID 、 类 型 等 标识 性 属性 ， 如 果 能 定义 


成 从 0 开始 的 连续 整数 , 也 可 以 利用 数组 和 


数组 下 标的 特殊 关系 , 简化 数据 模型 ,优化 代码 结构 。 


比如 第 8 章 介绍 “ 爱 因 斯 坦 的 思考 题 ” 解 法 时 ， 就 将 房子 颜色 、 国 籍 、 饮 料 类 型 、 宠 物 和 香烟 牌 
子 作为 类 型 属性 ， 定 义 成 从 0 开始 的 索引 值 〈 为 保证 可 读 性 ， 定 义 成 有 意义 的 常量 值 ): 


type_house = 0， 
type_nation = 1， 
type _ drink = 2， 
type_pet = 3， 
type cigaret = 4 


然后 将 这 五 种 类 型 属性 定义 成 数组 : 


int itemValue[GROUPS ITEMS]; 
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现在 要 查看 一 个 GROUP 绑 定 组 中 房子 的 颜色 是 否 是 蓝 色 ， 就 可 以 这 样 编写 代码 : 

if(group.itemValue[type_house] == COLOR BLUE) 

这 样 的 例子 应 用 得 非常 广泛 ， 只 要 控制 好 数组 越界 问题 ,巧妙 地 设计 数据 结构 , 定义 有 意义 
的 常量 名 称 ， 可 以 在 不 影响 代码 可 读 性 的 基础 上 极 大 地 简化 算法 实现 。 


A.2 一 重 循环 实现 两 重 循环 的 功能 


二 维 表 的 遍历 一 般 需 要 两 重 循环 来 实现 , 但 是 两 重 循环 的 代码 不 如 一 重 循环 的 代码 清 碍 ,很 
多 情况 下 用 一 重 循环 遍历 二 维 表 也 是 一 种 不 错 的 选择 。 用 一 重 循环 遍历 二 维 表 关 键 是 对 下 标的 处 
理 ， 对 于 一 个 MxN 的 二 维 表 ， 可 用 以 下 方法 解 出 对 应 的 二 维 下 标 : 


int row=i/M 
int col = i %N 


反 过 来 ， 也 可 以 用 以 下 公式 将 二 维 坐标 还 原 为 一 维 坐标 : 
int i = row * N+ col 


本 书 2.1.2 节 介 绍 循环 结构 时 , 就 介绍 了 一 个 用 一 重 循环 初始 化 九宫 格 游戏 棋盘 的 算法 实现 。 


A.3 棋盘 (迷宫) 类 算法 方向 遍历 


棋盘 或 迷宫 类 游戏 常常 需要 配合 各 种 搜索 算法 , 二 维 棋 盘 和 迷宫 的 搜索 常常 是 沿 着 与 某 个 位 
置 相 临 的 4 个 或 8 个 方向 展开 ,对 这 些 方向 的 遍历 就 是 搜索 算法 的 主要 结构 。 我 常常 看 到 一 些 朋 
友 给 出 的 算法 用 了 长 长 的 if-else 或 switch-case 语句 ， 无非 是 这 样 的 结构 : 


switch(direction) 
case UP: 
3 DOWN: 
CS LEFT: 
Ed RIGHT: 

. Se 


观察 每 一 个 case 分 文 ， 除 了 数组 下 标 计算 不 同 ， 其 他 代码 都 是 雷同 的 重复 代码 。 其 实 这 种 
情况 下 最 常用 的 方法 是 使 用 方向 偏 移 数组 , 用 一 个 循环 对 这 个 方向 数组 遍历 一 遍 就 可 完成 对 各 个 
方向 的 搜索 。 以 二 维 数组 定义 的 棋盘 为 例 ， 如 果 从 i 行 j 列 开始 向 上 、 下 、 左 、 右 4 个 方向 搜索 ， 
则 这 4 个 方向 可 转换 为 以 下 行 、 列 坐标 关系 。 

口 向 左 搜索 : 行 坐标 i 不 变 ， 列 坐标 六 1 
口 向 上 搜索 : 行 坐 标 于 1 不 变 ， 列 坐标 不 变 
口 向 右 搜索 : 行 坐标 ;不 变 ， 列 坐标 片 1 
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口 向 下 搜索 : 行 坐标 计 1 不 变 ， 列 坐标 不 变 
根据 以 上 关系 ， 首 先 定 义 二 维 数组 下 标 偏 移 量 : 


typedef struct tagIdxOffset 
{ 

int row offset ; 

int col _ offset ; 
}OFFSET; 


然后 定义 一 个 偏 移 量 数 组 ， 分 别 表示 向 4 个 方向 的 数组 下 标 


下 上 
RS 
Ll 


OFFSET dir offset[] = {{0,-1},{-1,0},{0,1},{1,0}}; 
假设 当前 位 置 的 二 维 数组 下 标 是 row，col， 则 对 此 位 置 开始 向 4 个 方向 搜索 的 代码 可 以 如 此 


实现 : 


for(int i = 0; i «< count of(dir offset); i++) 


int cur row = x + dir offset[i]. 
int cur col = y + dir offset[i]. 


} 


row offset; 
col offset; 


这 种 算法 实现 避免 了 对 每 个 方向 都 进行 下 标 计 算 , 即便 是 增加 两 个 斜 线 方向 ， 从 4 个 方向 搜 
索 扩 展 到 8 个 方向 搜索 ， 只 需 调整 dir offset 数组 即 可 ， 摆 脱 了 宛 长 的 switch-case 代码 结构 。 


本 书 的 14.5.1 节 介 绍 填 充 算法 的 时 候 就 使 用 了 方向 数组 。 第 20 章 介绍 华容 道 游 戏 的 时 候 再 


次 使 用 了 方向 数组 ， 都 是 类 似 情况 下 的 典型 应 用 。 


A.4 ”代码 的 一 致 性 处 理 技巧 


经 常 做 测试 的 程序 员 都 知道 ,数据 操作 的 边界 是 最 容易 出 错 的 地 方 , 从 代码 实现 的 角度 理解 
这 个 问题 , 是 因为 边界 数据 的 处 理 往往 和 内 部 数据 的 处 理 不 太一 样 。 第 1 童 介 绍 环形 队列 的 时 候 
我 们 就 遇 到 了 这 样 的 问题 , 因为 内 存 中 没有 真正 的 环形 数据 存储 机 制 , 因此 我 们 设计 的 环形 队列 
是 个 逻辑 存储 结构 ， 内 部 是 用 数组 做 存储 支撑 。 环 形 队 列 是 无 界 的 , 但 是 数组 是 有 界 的 ， 这 就 产 
生 一 个 问题 ，tail 指针 每 次 向 后 移动 时 ， 都 要 判断 是 否 移动 到 数组 的 边界 。 在 这 个 例子 中 , 我 们 


用 以 下 方式 解决 了 这 个 问题 : 


tail = (tail + 1) %AN 


当 tail 指针 超过 数组 的 下 标 时 ， 这 个 对 NN 取 余 的 操作 会 让 tail 自动 调整 到 数组 的 头 部 ， 避 


免 了 if-else 特殊 人 处理， 这 是 个 一 致 怕 


上 处 到 


的 简单 例子 。 


第 4 童 在 介绍 阿拉 伯 数 字 与 中 文 数字 转换 时 提 到 中 文 节 权 位 的 一 些 规则 , 万 以 上 的 数字 节 权 


位 是 “万 ”， 亿 以 上 的 数字 节 权 位 是 “ 亿 ”, 但 是 万 以 下 的 数字 没有 节 权 位 ， 这 就 是 个 例外 ， 代 码 
中 可 能 到 处 需要 对 这 个 例外 进行 处 理 。 现 在 换个 思路 , 给 节 权 位 定义 一 个 索引 , 万 以 下 索引 为 0， 
万 以 上 索引 为 1， 超 过 亿 索 引 为 2， 以 此 类 推 ， 这 样 就 可 以 定义 一 个 节 权 表 : 
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const char *chnUnitSection[] = {"",， "万 "," 亿 ", "万 亿 " 月 

在 确定 节 权 的 时 候 根 据 节 权 位 索引 查 这 个 表 ， 代 码 按照 一 致 的 方法 添加 节 权 位 : 

chnString += chnUnitSection[widx]; 

没有 方 权 位 时 得 到 一 个 空 字符 串 ，chnstring 加 一 个 空 字符 串 不 影响 结果 ， 就 这 样 避免 了 对 
节 权 位 的 if-else 判断 。 

本 书 第 23 章 介绍 Tic-Tac-Toe 游戏 时 ,还 介绍 了 一 种 利用 预先 编制 的 数据 表 对 某 些 操作 进行 
一 致 性 处 理 的 方法 。Tic-Tac-Toe 游戏 需要 判断 是 否 有 三 点 连 成 一 线 , 检查 的 方向 有 横 、 竖 和 两 条 
和 斜 交 又 线 共 8 个 方向 。 如果 按照 一 般 的 处 理 方法 ,可 能 需要 分 别 用 四 种 数组 下 标 处 理 方法 才能 完 
成 对 8 个 方向 的 处 理 。 但 是 23.2.1 节 介 绍 了 一 个 方法 , 将 8 个 方向 的 数组 下 标 预先 存 为 一 张 数据 
表 , 检查 三 点 一 线 的 时 候 直接 从 这 张 数据 表 获 取 每 个 方向 对 应 的 数组 下 标 , 使 用 一 个 循环 就 完成 
了 对 8 个 方向 的 检查 ， 这 也 是 一 致 性 处 理 的 例子 。 

除了 以 上 几 个 例子 , 很 多 算法 还 通过 设置 标志 位 来 避免 算法 实现 过 程 中 频繁 判断 边界 值 的 状 
态 。 本 书 的 第 20 章 和 第 22 章 在 棋盘 中 设置 的 棋盘 边界 标志 位 ， 就 是 这 种 一 致 性 处 理 的 示例 , 通 
过 边界 值 的 一 些 特殊 设置 , 避免 了 对 棋盘 边界 值 的 特殊 判断 , 相关 的 原理 都 已 经 在 相关 章节 中 做 
了 具体 的 说 明 。 这 些 标志 位 在 一 些 算法 中 也 称 为 “哨兵 位 ”>， 比 如 搬入 排序 算法 ， 就 在 待 排序 的 
线性 表 的 最 前 面 放置 一 个 比 数列 中 最 小 的 数 还 小 的 数 作为 哨兵 位 , 在 插入 搜索 过 程 中 就 不 需要 每 
次 都 判断 线性 表 的 下 标 是 否 移动 到 了 表 头 。 

在 算法 设计 中 巧妙 地 使 用 一 致 性 处 理 , 可 以 极 大 地 减少 算法 实现 的 复杂 度 , 写 出 短小 精 悍 的 
算法 实现 。 把 算法 代码 写 短 一 点 的 意义 不 仅 是 展示 技巧 ， 更 重要 的 原因 是 腑 肿 的 代码 容易 出 错 ， 
越 短 的 代码 越 不 容易 出 错 。 在 算法 中 使 用 一 致 性 技巧 , 需要 巧妙 地 设计 算法 , 精心 构造 数据 结构 ， 
必要 时 需要 事先 计算 并 构造 一 些 数 据 表 ， 没 有 定 势 的 方法 ， 只 能 在 各 种 算法 中 体会 。 


A.5 ”链表 和 数组 的 配合 使 用 


动态 存储 的 线性 表 常 常用 链表 表示 ， 但 是 频繁 的 插入 和 删除 操作 会 使 得 内 存 操作 的 压力 很 
大 , 频繁 地 申请 和 释放 内 存 严重 影响 算法 效率 。 为 此 人 们 提出 了 很 多 将 链表 和 数组 的 优点 结合 在 
一 起 的 方法 ， 比 如 数组 链表 ， 这 个 在 本 书 第 2 章 也 提 到 过 。 第 23 章 我 们 还 介绍 了 另 一 种 将 数组 
和 链表 相 结合 的 方法 ， 就 是 黑白 棋 算法 中 用 到 的 空位 链表 。 黑 白 棋 使 用 8 x 8 的 棋盘 ， 棋 盘 上 的 
空位 最 多 就 是 64 个 ， 因 此 可 以 利用 数组 定义 一 次 性 分 配 好 内 存 : 

EMPTY_LIST m Empty s[64]; 

再 定义 一 个 头 节 点 : 

EMPTY_LIST m EmHead; 

最 后 再 用 相关 的 指针 将 它们 串 成 链表 : 


void GameState: :InitEmptyList() 
{ 
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int k = 0; 
EMPTY _ LIST *pt = &m EmHead; 
for(int i = 0; i < BOARD CELLS; i++) 


{ 
if(m board[i] == PLAYER NULL) 
pt->succ = &(m Empty_s[k]); 
m Empty_s[k].pred = pt; 
pt = pt->succ,; 
pt->cell = i; 
k++; 
} 
} 
pt->succ = NULL; 


} 
使 用 这 个 链表 就 可 以 不 用 考虑 内 存 的 申请 和 释放 ， 还 可 以 通过 直接 遍历 m_Empty_s 数组 了 解 
各 个 节点 的 情况 ， 这 种 方法 在 很 多 强调 内 存 分 配 效率 的 开源 软件 中 都 有 应 用 。 


A.6 “以 空间 换 时 间 ” 的 常用 技巧 


“以 空间 换 时 间 ” 也 是 算法 设计 中 常用 的 提高 算法 效率 的 技巧 ， 有 时 也 可 用 于 一 致 性 处 理 技 
巧 简 化 算法 实现 。 我 们 来 举 个 简单 的 例子 , 加 入 我 们 需要 对 cell_info 按照 掩 码 进行 不 同 的 处 理 : 


for(int i = 0; i < 8; i++) 


{ 
unsigned char mask = Ox01 << i); 
if(cell info & mask) 
{ 
//do something 
} 
} 


mask 掩 人 码 每 次 都 需要 通过 0x01 移 位 得 到 ， 如 果 我 们 换个 方式 ， 事先 计算 好 一 个 掩 码 表 : 
unsigned char mask tbl[] = {0x01, Ox02, Ox04, Ox08, OxX10, Ox20,0x40，0x80}; 
然后 就 可 以 将 代码 修改 为 : 


for(int i = 0; i < 8; i++) 


if(cell info & mask tbl[i]) 
{ 


} 


//do something 


} 

这 就 是 “以 空间 换 时 间 ”。 当 然 ， 这 是 一 个 微不足道 的 例子 , 但 是 这 种 策略 在 很 多 地 方 都 得 
到 了 应 用 , 特别 是 这 种 计算 比较 繁琐 或 耗 时 的 时 候 ,， 预先 准备 好 这 些 结果 ， 避 人 免 每 次 都 计算 就 是 
一 个 很 好 的 策略 。 本 书 第 7 童 介绍 的 舞伴 之 间 的 偏爱 关系 表 和 第 23 章 介 绍 的 棋盘 位 置 价值 表 都 
是 这 种 “以 空间 换 时 间 ” 策 略 的 应 用 示例 。 
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A.7 利用 表 驱 动人 避免 长 长 的 switch-case 


函数 表 驱 动 是 状态 机 设计 常用 的 方法 , 拿 来 在 一 般 场合 下 使 用 , 有 时 候 也 可 以 起 到 非常 好 的 
代码 优化 效果 。 代码 中 出 现 常常 的 switch-case 结构 或 if-else 结构 往往 是 代码 元 余 的 表现 , 将 这 
些 分 支 的 处 理 代码 提炼 成 函数 往往 是 解决 问题 的 第 一 步 , 但 是 仅仅 这 样 做 还 不 够 。 接 下 来 还 要 统 
一 这 些 函 数 的 接口 ， 如 果 能 提供 一 致 的 接口 ， 则 可 将 其 转换 成 函数 表 ， 从 而 以 一 种 更 优雅 的 方式 
重 构 这 上段 代码 。 本 书 2.1.3 节 介 绍 分 支 跳 转 结构 时 介绍 了 一 个 这 样 构造 函数 表 的 例子 ， 具 体 的 实 
现代 码 请 参考 我 的 博客 。 

以 上 是 经 典 的 重 构 书 中 都 会 介绍 的 代码 优化 方法 , 重点 是 需要 提炼 出 一 批 函 数 。 假如 通过 上 
述 优化 最 后 得 到 了 一 批 接 口 一 致 的 函数 , 却 发 现 这 些 函 数 所 做 的 事情 几乎 一 模 一 样 怎么 办 ?这 也 
是 问题 ， 因 为 有 重复 代码 。 现 在 反 过 来 考虑 这 个 问题 ， 能 否 将 条 件 抽象 成 一 致 的 外 观 ， 从 而 用 一 
个 函数 一 致 地 处 理 这 些 条 件 呢 ? 这 也 是 表 驱 动 的 方法 , 本 书 第 6 章 介绍 的 过 河 动作 表 列 表 ， 就 使 
用 了 这 种 方法 ， 将 过 河 动作 抽象 成 一 组 数据 ， 然 后 用 一 个 函数 一 致 地 处 理 所 有 的 过 河 动作 。 

switch-case 结构 或 长 长 的 if-else 分 支 结构 往往 意味 着 代码 违反 了 “ 开 闭 原则 ”, 这 样 的 代码 
结构 往往 会 随 着 后 期 代码 的 维护 和 功能 的 增多 不 断 增加 新 的 case 分 支 和 else 分 支 ， 使 得 代码 对 
修改 永远 无 法 封闭 。 避 免 这 种 代码 结构 的 方法 有 很 多 ,除了 本 节 介 绍 的 提炼 函数 表 的 方法 ,第 3 
节 介绍 的 方法 和 第 4 节 介 绍 的 一 致 性 处 理 技巧 也 是 代 蔡 switch-case 结构 的 常用 方法 。 


在 本 书 的 第 23 章 介绍 了 几 种 基于 博弈 树 搜索 的 棋 类 游戏 AI 算法 设计 , 为 了 演示 这 一 章 介绍 


的 三 种 棋 类 游戏 的 AI 算法 ,我 们 设计 了 三 个 可 以 实现 人 机 对 战 的 简单 棋 类 游戏 。 这 三 个 游戏 程 


附 系 B 


一 个 棋 类 源 戏 的 设计 框 淋 


序 使 用 了 一 套 相似 的 代码 框架 ,第 23 章 着 重 介绍 博弈 树 的 搜索 算法 设计 ， 并 没有 介绍 这 套 代码 
框架 。 如 果 读 者 想 在 本 书 的 代码 基础 上 进一步 演化 和 优化 搜索 算法 ， 实 现 自己 的 智能 AI 算法 ， 


则 需要 了 解 一 下 这 个 代码 


B.1 


这 个 框架 


E 架 ， 现 在 我 们 就 简单 介绍 一 下 这 个 代码 框架 的 设计 结构 。 


代码 框架 的 整体 结构 
从 整理 上 看 ， 


5 部 分 组 成 , 分 别 是 搜索 算法 、 评 估算 子 、 棋 盘 状 态 、 游 戏 玩家 和 


游戏 控制 咒 。 游 戏 控制 部 〈 GameControl ) 有 一 个 棋盘 状态 对 象 和 两 个 游戏 玩家 对 象 ， 通 过 一 个 
循环 控制 两 个 玩家 轮流 落 子 ， 操 作 棋 盘 状 态 对 象 ， 它 们 之 间 的 关系 如 图 B-1 所 示 。 


GameState 


#m_playerld: int 


GameControl 
#m_gameState.GameState 


#m players:player 


+SetPlayer( ) 
+Getplayer( ) 
+InitGameState( ) 


+Run( ) 


#m_board: int[:] 
#m_evaluator 


+Settvaluator( ) 
+PrintGame( ) 
+Evaluate( ):int 

1 +InitGamestate( ) 
+IsGame0ver( ) :boo1 
+GetWinner( ) :int 


Player 


#m_playerId: int 


#m_state 


#m_playerName: std: :string 


+CetNextposition( ): int 


HumanPlayer 


ComputerPlayer 


+GetNextPosition( ):int 


Hm Searcher: Searcher 
#m_depth :int 


图 B-1 


+GetNextPosition( ):int 
+SetSearcher( ) 


游戏 控制 器 关系 图 
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游戏 玩家 是 一 个 标准 接口 ， 游 戏 控制 器 通过 setPlayer() 接 口 为 每 局 游戏 指定 两 个 玩家 对 象 ， 
可 以 是 两 个 人 类 玩家 对 战 , 也 可 以 是 两 个 计算 机 玩家 对 战 , 也 可 以 是 一 个 人 类 玩家 和 一 个 计算 机 
玩家 对 战 。 人 类 玩家 通过 一 个 控制 台 界 面 要 求 玩家 输入 落 子 位 置 , 计算 机 玩家 通过 m_searcher 指 


定 的 搜索 算法 搜索 最 佳 的 落 子 位 置 。 


计算 机 玩家 与 搜索 算法 的 关系 如 图 B-2 所 示 , 计算 机 玩家 通过 指定 的 搜索 算法 决定 最 佳 落 子 
位 置 。 通过 SetSearcher() 接 口 函数 可 以 为 计算 机 玩家 对 象 指定 搜索 算法 ,搜索 算法 通过 Searcher 


接 


原型 是 : 


virtual int SearchBestPlay(const GameState& state, int depth); 


游戏 控制 器 拥有 并 负责 维护 一 个 唯一 的 Gamestate 对 象 g gameState， 相 当 于 游戏 过 程 中 的 横 


盘 状 态 。 所 有 游戏 玩家 应 该 能 够 看 到 这 个 棋盘 状态 ， 因 此 Player 内 有 一 个 m_state 


口 提 供 一 个 SearchBestpPlay() 方 法 对 GameState 对 象 执行 博弈 树 搜索 ，SearchBestPlay() 方 法 的 


就 是 指向 g_gameState 对 象 的 一 个 指针 或 引用 ，Searcher 接口 提供 的 SearchBestPlay() 方 法 通过 
m_state 属性 可 以 访问 当前 的 棋局 状态 。SearchBestPlay() 方 法 只 能 “ 


改 , 所 以 其 接口 使 用 了 const 访问 控 


重要 ,就 像 两 个 人 下 棋 , 双方 都 可 以 在 大 脑 中 思考 棋局 如 何 展开 , 但 是 只 有 轮 到 自己 下 棋 


才 可 以 落 子 。 


看 ”这 个 棋盘 状态 ， 不 能 修 
央 。 只 有 游戏 控制 器 可 以 修改 & gamestate 的 状态 , 这 一 点 很 


ComputezP1layez 


#m searcher:Searcher 
#m depth:int 


+CGetNextPosition(): int 


的 时 候 


SearchBestPplay(...); 


1 |tSetSearcher() \ 
<< 接 口 >> int GetNextposition() 
ET 二 
上. 
AlphaBetaSearcher| NegamaxSearcher 
+SearchBestPplay() | | |+SearchBestPlay() 
#AlphaBeta() #NegaMax() 
MinimaxSearcher 
+SearchBestPplay() 
#MinMax() 
图 B-2 计算 机 玩家 与 搜索 算法 关系 图 


搜索 算法 在 博弈 树 搜索 过 程 中 会 产生 很 多 临时 的 Gamestate 棋 


进行 评估 , 评估 算法 有 很 多 种 , 通过 评估 算 子 


GameState 与 评估 算 子 Evaluator 的 关系 如 图 B-3 所 示 ，Eva 
virtual int Evaluate(GameState® state, int max player id); 


GameState 对 象 通过 Evaluate 方法 将 自己 “托付 ”给 评 


Evaluator 接口 ，Ga 


局 状态 ， 并 且 对 这 些 棋 局 状态 
estate 可 以 任意 设置 评估 算法 。 
luate 方 法 的 原型 如 下 : 


局 评估 ， 评 估 的 结果 是 
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max_player_id 所 代表 的 游戏 玩家 从 这 个 棋局 中 得 到 的 利益 。 


ComputerPlayer computer("ThinkPad X200"); 


Gamestate 


<< 接 口 >> 


#m playerld: int 
#m board:int [] 
#m evaluator 


1 Evaluator 


+SetEvaluator() 
+PrintGame() 
+Evaluate() :int 
+InitGameState() 
+IsGameOver():bool 
+GetWinner().;int 


1 +EValuate( ) ,int 


ConcreteEvaluatou 


+EValuate():int 


int Evaluate() 
{ 

m_evaluator- > Evaluate(); 
} 


图 B-3 GameState 与 评估 算 子 Evaluator 关系 图 


B.2 代码 框架 的 使 用 方法 


这 个 代码 框架 的 使 用 非常 简单 ， 首先 初始 化 两 个 玩家 对 象 , 我 们 以 一 个 人 类 玩家 和 一 个 计算 
机 玩家 为 例 , 看 看 如 何 开始 一 个 人 机 博弈 游戏 。 需 要 注意 的 是 ,需要 为 计算 机 玩家 指定 博弈 树 搜 
索 算法 和 每 一 步 的 搜索 深度 ， 初 始 化 游戏 玩家 的 代码 如 下 : 


AlphaBetaSearcher as; 
HumanPlayer human(" 张 三 "); 


computer.SetSearcher(&as, SEARCH DEPTH); 


我 们 为 计算 机 玩家 指定 了 带 “o-B” 剪 枝 的 极 大 极 小 值 搜索 算法 。 接 下 来 初始 化 棋盘 


( GameState ): 


WzEvaluator wz 
GameState init 


Func; 
state; 


init state.InitGameState(PLAYER A); 


init state.Set 


InitGameState 


Evaluator(&wzFunc); 


) 函 数 输入 的 参数 PLAYER A 表示 ID 是 PLAYER A 的 游戏 玩家 在 这 个 棋局 中 先 


手 落 子 。 当 然 , 我们 也 可 以 一 开始 就 在 棋盘 上 放 一 些 棋子 ,这 在 研究 一 些 残局 博弈 或 测试 佑 值 函 


数 时 非常 有 用 ， 通 过 调用 GameSstate 的 SetGameCel1() 接 口 可 以 预先 在 指定 的 位 置 放置 棋子 。 


接 下 来 就 是 初始 化 游戏 控制 锅 ， 为 其 指定 游戏 玩家 和 初始 棋盘 状态 : 


GameControl gc; 
gc.Setplayer(&computer, PLAYER A); 
gc.Setplayer(&human, PLAYER B); 


gc.InitGameSta 


te(init state); 


这 上段 代码 指定 计算 机 玩家 ID 为 PLAYER_A， 人 类 玩家 了 Dp 为 PLAYER_B, 将 init_state 棋 
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盘 状 态 作 为 对 局 的 开始 状态 ， 也 就 是 说 电脑 玩家 将 先 手 落 子 。 最 


游戏 : 


gc.Run(); 


只 要 调用 Run() 函 数 即 可 开始 


Run() 函 数 的 实现 非常 简单 ,通过 一 个 循环 驱动 双方 不 断 落 子 ,直到 游戏 结束 后 给 出 输赢 结果 。 


void GameControl: :Run() 


while(!m gameState.IsGameOver()) 

{ 
int playerId = m gameState.GetCurrentPlayer(); 
Player *currentPlayer = GetPlayer(player1d); 
assert(currentPlayer != NULL); 


int np = currentPplayer->GetNextPosition(); 
m gameState.PutChess(np, player1d); 
m gameState.PrintGame(); 
m gameState.Switchplayer(); 
} 
int winner = m gameState.GetWinner(); 
if(winner == PLAYER NULL) 


{ 
std::cout << "GameOver, Draw!" «< std::endl; 
} 
else 
{ 
Player *winnerPlayer = GetPlayer(winner); 
std::cout << "GameOver, " 
<< winnerplayer->GetPlayerName() 
<x< " Win!l" <x std::endl; 
} 


} 


使 用 这 个 代码 框架 编写 人 机 博弈 游戏 , 我 们 只 需 将 注意 力 集中 在 搜索 算法 和 评估 算 子 的 设计 
上 即 可 。 必 要 的 时 候 可 以 根据 棋 类 游戏 的 规则 适当 修改 一 下 Gamestate 的 设计 ， 关 于 GameState 
的 设计 其 实 还 可 以 更 抽象 一 点 ， 不 过 我 暂时 还 没有 思路 ， 有 兴趣 的 读者 可 以 自行 扩展 。 
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地 展现 了 算法 的 趣味 性 和 实用 性 。 其 中 ， 既 有 各 种 大 名 昂昂 的 算法 ， 如 神经 网 络 、 遗 传 算法 、 离 
散 傅 里 叶 变换 算法 及 各 种 插值 算法 ， 也 有 不 起 眼 的 排序 和 概率 计算 算法 。 书 中 所 有 的 示例 都 与 生 
活 息息相关 ， 淋 漓 尽 致 地 展现 了 算法 解决 问题 的 本 质 ， 让 你 爱 上 算法 ， 乐 在 其 中 。 


算法 之 大 ， 大 到 可 以 囊括 宇宙 万 物 的 运行 规律 ; 算法 之 小 ， 小 到 密 密 数 行 代 码 即 可 展现 一 
个 神奇 的 功能 。 算 法 的 应 用 和 乐趣 在 生活 中 无 处 不 在 : 

dh 历法 和 二 十 四 节气 计算 使 用 的 是 霍 纳 法 则 和 求解 一 元 高 次 方程 的 牛顿 迭代 法 ; 

人 音频 播放 器 跳动 的 实时 频谱 背后 是 离散 傅 里 叶 变 换算 法 ; 

人 DOS 时 代 著 名 的 PCX 图 像 文件 格式 使 用 的 是 简单 有 效 的 RLE 压 缩 算法 ; 

人 RSA 加 密 算法 的 光环 之 下 是 朴实 的 欧 几 里 得 算法 、 和 蒙哥马利 算法 和 米 勒 - 拉 宾 算法 ; 

人 并 字 棋 、 黑 白 棋 、 五 子 棋 和 俄罗斯 方块 游戏 背后 有 着 各 种 有 趣 的 AI 算法 ; 

< 华容 道 游 戏 求解 的 简单 穷 举 算 法 中 还 蕴藏 着 对 棋盘 状态 的 哈 希 算法 ; 

< 证 传 算法 似乎 深 不 可 测 ， 但 用 遗传 算法 求解 0-1 背 包 问 题 只 用 了 60 多 行 代码 …… 


而 这 只 是 冰山 一 角 ， 五 彩 缤纷 的 算法 世界 等 待 你 来 探寻 。 
打开 本 书 ， 尽 享 算法 的 乐趣 。 


图 灵 社 区 ; iTuring.cn 
热线 . (010) 51095186 转 600 9 "T87115"385376"> 


bsE 寺 当 全 计算 机 /计算 机 科学 /计算 机 算法 ISBN 978-7-115-38537-6 


人 民 邮 电 出 版 社 网 址 . Wwww.ptpress.com.cn 定价 : 69.00 元 


看 完了 


如 果 您 对 本 书 内 容 有 疑问 ， 可 发 邮件 至 contact@turingbook.com， 会 有 编辑 或 作 
译 者 协助 答疑 。 也 可 访问 图 灵 社 区 ， 参 与 本 书 讨论 。 


如 果 是 有 关 电 子 书 的 建议 或 问题 ， 请 联系 专用 客服 邮箱 : 


ebook@turingbook.com。 
在 这 可 以 找到 我 们 : 


微 博 @ 图 灵 教育 : 好 书 、 活 动 每 日 播报 

微 博 @ 图 灵 社 区 : 电子 书 和 好 文章 的 消息 

微 博 @ 图 灵 新 知 : 图 灵 教 育 的 科普 小 组 
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